Spark实战大数据离线与实时项目整合大数据生态圈多个框架

课程介绍(A000425)：

本课程整合Redis和HBase打造以Spark技术栈为核心的离线处理项目以及实时处理项目，以功能实现为基础，通过调优及重构功能实现，达到企业级生产水平。课程最后讲解Alluxio整合Hadoop和Spark的使用，拓展同学们的视野。

课程目录：

第1章课程介绍&学习指南 试看2 节 | 12分钟
本章会对这门课程进行说明并进行学习方法介绍。
收起列表
- 视频：1-1 课程介绍 (11:26)试看
- 图文：1-2 ***学前必读***（助你平稳踩坑，畅学无忧，课程学习与解决问题指南）
第2章 Redis入门 试看12 节 | 126分钟
Redis是目前最火爆的内存数据库之一，通过在内存中读写数据，大大提高了读写速度。本章将从Redis特性、应用场景出发，到Redis的基础命令，再到Redis的常用数据类型实操，最后通过Java API来操作Redis，为后续实时处理项目打下坚实的基础…
收起列表
- 视频：2-1 课程目录 (02:44)
- 视频：2-2 Redis概述 (10:06)
- 视频：2-3 Redis特性 (10:14)
- 视频：2-4 Redis应用场景 (06:50)
- 视频：2-5 Redis部署&服务启停&客户端连接 (17:09)
- 视频：2-6 Redis多数据库特性 (07:04)试看
- 视频：2-7 Redis基础命令的使用 (09:35)
- 视频：2-8 Redis数据类型之string (15:14)
- 视频：2-9 Redis数据类型之list (17:39)
- 视频：2-10 Redis基本数据类型之set (13:53)
- 视频：2-11 使用Jedis对Redis进行操作 (09:55)
- 视频：2-12 Redis工具类开发 (04:54)
第3章 HBase入门20 节 | 142分钟
HBase是一个分布式的、面向列的开源数据库，该技术来源于 Fay Chang 所撰写的Google论文“Bigtable：一个结构化数据的分布式存储系统”。本章将从HBase是什么、有哪些特点出发，到HBase环境部署，到HBase的数据模型，到HBase的操作(命令行&API)，为后续离线处理项目的数据存储以及查询打下坚实的基础。…
收起列表
- 视频：3-1 数据存储现状 (07:26)
- 视频：3-2 HBase是什么 (05:58)
- 视频：3-3 HBase在生态圈中的位置以及列式存储带来的好处 (07:49)
- 视频：3-4 HBase的特点.mp4 (05:23)
- 视频：3-5 HBase vs RDBMS vs HDFS.mp4 (05:15)
- 视频：3-6 HBase的优势 (02:58)
- 视频：3-7 HBase数据模型 (09:47)
- 视频：3-8 JDK环境搭建 (04:19)
- 视频：3-9 Hadoop环境部署(详解一个常见的错误解决方案) (14:41)
- 视频：3-10 ZooKeeper环境部署 (03:32)
- 视频：3-11 HBase环境部署 (09:01)
- 视频：3-12 HBase shell DDL操作 (06:28)
- 视频：3-13 HBase shell DML操作 (09:48)
- 视频：3-14 HBase API编程之开发前置准备工作 (10:31)
- 视频：3-15 HBase API编程之创建表以及查询表和所有列族 (07:32)
- 视频：3-16 HBase API编程之添加和修改记录 (07:41)
- 视频：3-17 HBase API编程之通过RowKey获取值 (05:47)
- 视频：3-18 HBase API编程之Scan (08:39)
- 视频：3-19 HBase API编程之Filter (06:09)
- 视频：3-20 HBase API编程之总结 (02:27)
第4章离线项目实战V1 试看22 节 | 182分钟
本章节讲解基于Spark和HBase的离线综合项目实战，从多个框架的整合出发，到使用Spark进行ETL处理然后数据落地到HBase中涉及到的传参、HBase Rowkey的设计，再到性能的初步调优，最后使用Spark整合HBase进行数据的统计分析。本章是基于Spark进行离线处理的重点，务必掌握。…
收起列表
- 视频：4-1 课程目录 (03:03)
- 视频：4-2 项目背景 (09:31)
- 视频：4-3 项目处理流程.mp4 (11:03)
- 视频：4-4 项目离线和实时架构图 (12:01)
- 视频：4-5 明确架构图中每个步骤使用的技术以及职责所在 (06:32)试看
- 视频：4-6 项目指标需求 (03:57)
- 视频：4-7 功能开发之UserAgent解析(掌握如何获取技能) (16:46)
- 视频：4-8 功能开发之IP解析思路 (02:12)
- 视频：4-9 功能开发之Spark和HBase依赖整合 (03:39)
- 视频：4-10 开发环境依赖使用说明 (09:16)
- 视频：4-11 功能开发之解析日志成DataFrame并为DataFrame添加字段信息 (08:32)
- 视频：4-12 功能开发之将DF内容转成HBase要存储的列 (15:03)
- 视频：4-13 功能开发之整体ETL流程详解及如何传参设计 (10:20)
- 视频：4-14 功能开发之创建HBase表 (13:54)
- 视频：4-15 功能开发之HBase Rowkey设计_1 (10:07)
- 视频：4-16 功能开发之完成ETL数据到HBase落地的全过程 (09:10)
- 视频：4-17 功能开发之完成第一个指标的统计分析 (19:10)
- 视频：4-18 功能开发之完成第二个指标的统计分析 (03:33)
- 视频：4-19 性能优化之缓存的使用 (04:13)
- 视频：4-20 功能开发之统计功能使用DataFrame API以及SQL API来完成 (06:33)
- 视频：4-21 本章小结 (02:29)
- 作业：4-22 【讨论题】关于Spark RDD核心算子的思考
第5章离线项目实战优化11 节 | 109分钟
本章节将基于前面一个章节的功能实现进行进一步的优化，如何将在需求功能实现的基础之上，进行调优，使得在生产上的执行效率更高。本章将是提升自身综合实力的关键部分，务必掌握。
收起列表
- 视频：5-1 课程目录 (02:15)
- 视频：5-2 Spark on YARN (12:02)
- 视频：5-3 Linux时间获取 (04:13)
- 视频：5-4 shell封装Spark作业提交脚本 (23:27)
- 视频：5-5 将统计结果写入到MySQL中 (15:19)
- 视频：5-6 统计结果写入到MySQL调优 (04:06)
- 视频：5-7 Spark ETL到HBase优化之禁用WAL (18:29)
- 视频：5-8 Spark ETL到HBase的HFile思路 (03:49)
- 视频：5-9 Spark产生HFile文件格式准备工作 (10:55)
- 视频：5-10 Spark产生HFile整个流程实现并总结 (14:06)
- 作业：5-11 【讨论题】Spark OOM问题
第6章实时项目实战15 节 | 103分钟
本章节讲解基于Spark和Redis的实时综合项目实战，从Spark Streaming整合Kafka对接出发，如何实现需求的功能以及如何对代码进行重构使得执行效率更好，掌握Redis在项目实战中的数据类型选型，以及如何将SparkStreaming处理完的数据写入到Redis中去。…
收起列表
- 视频：6-1 课程目录 (01:58)
- 视频：6-2 项目背景 (02:31)
- 视频：6-3 项目架构及处理流程 (05:01)
- 视频：6-4 项目需求 (02:43)
- 视频：6-5 开发环境准备及参数配置统一管理 (11:46)
- 视频：6-6 Kafka部署及测试 (05:45)
- 视频：6-7 Mock数据 (08:34)
- 视频：6-8 发送数据到Kafka (12:56)
- 视频：6-9 SparkStreaming对接Kafka数据 (06:18)
- 视频：6-10 功能实现之每天的粒度统计..1 (15:54)
- 视频：6-11 功能开发之调优 (04:36)
- 视频：6-12 功能实现小结 (03:37)
- 视频：6-13 功能实现之每小时统计及代码重构 (12:54)
- 视频：6-14 SparkStreaming对接Kafka offset管理 (07:57)
- 作业：6-15 【讨论题】SparkStreaming对接Kafka数据在项
第7章初识Alluxio13 节 | 108分钟
Alluxio是一个以内存为中心的虚拟分布式存储系统，统一数据访问和桥梁的计算框架和底层存储系统。应用程序只需要Alluxio就可以把访问存储在任何底层存储系统的数据连接。本章节将从Alluxio为我们带来的好处出发，再到Alluxio如何整合Hadoop以及Spark进行实操，并分享一些Alluxio在大公司中的使用案例。…
收起列表
- 视频：7-1 课程目录 (02:05)
- 视频：7-2 概述 (08:41)
- 视频：7-3 Spark应用存在的问题分析 (08:39)
- 视频：7-4 Alluxio能为我们带来什么 (08:05)
- 视频：7-5 Alluxio特点 (05:46)
- 视频：7-6 在Spark实战项目中引入Alluxio (07:28)
- 视频：7-7 Alluxio部署 (11:29)
- 视频：7-8 Alluxio文件系统命令行操作 (09:24)
- 视频：7-9 Alluxio整合HDFS使用 (08:15)
- 视频：7-10 Alluxio整合MapReduce使用 (08:07)
- 视频：7-11 Alluxio整合Spark使用 (06:29)
- 视频：7-12 Alluxio案例分享之在百度的使用 (11:36)
- 视频：7-13 Alluxio案例分享之在去哪儿的应用 (11:52)
第8章 Spark优化11 节 | 76分钟
本章节将从Spark在生产上的最佳实践出发，和大家分享Spark的常用优化策略。
收起列表
- 视频：8-1 课程目录 (04:26)
- 视频：8-2 调优之资源设置 (17:27)
- 视频：8-3 调优之算子的合理选择 (09:47)
- 视频：8-4 扩展之自定义排序一 (08:01)
- 视频：8-5 扩展之自定义排序二(附带经典面试题) (07:14)
- 视频：8-6 扩展之自定义排序(隐式转换) (04:27)
- 视频：8-7 Spark Streaming调优之Kafka限速 (07:30)
- 视频：8-8 Spark Streaming对接Kafka能真正做到仅消费一次吗 (03:29)
- 视频：8-9 调优之序列化 (05:05)
- 视频：8-10 调优之广播变量 (07:36)
- 作业：8-11 【讨论题】数据倾斜的思考
第9章（讨论群内直播内容分享）基于Spark定制ETL框架6 节 | 46分钟
了解Pipeline的处理方法，基于Spark外部数据源定制Spark ETL框架的思路及使用
收起列表
- 视频：9-1 Data Pipeline_x264 (06:19)
- 视频：9-2 ETL中可能会遇到的问题_x264 (05:38)
- 视频：9-3 (打标记处，3处听不清楚) Spark SQL DataSource API_x264 (06:40)
- 视频：9-4 使用Spark SQL处理json数据_x264 (10:26)
- 视频：9-5 基于Spark ETL框架的设计 (09:19)
- 视频：9-6 基于Spark ETL框架的使用_x264 (06:45)
第10章（讨论群内直播内容分享）Spark3新特性6 节 | 47分钟
Spark3是一个里程碑版的版本，其中包含很多新的特性，本次直播中主要带大家知晓新特性有哪些，以及讲解动态分区裁剪、外部数据源V2、自适应查询执行等相关知识。
收起列表
- 视频：10-1 Spark概述 (15:30)
- 视频：10-2 Spark3.x新特性 (05:13)
- 视频：10-3 DataSource API V2 (09:51)
- 视频：10-4 动态分区裁剪 (06:34)
- 视频：10-5 自适应查询执行 (08:57)
- 作业：10-6 【讨论题】简历项目问题

文件目录：

Spark实战大数据离线与实时项目整合大数据生态圈多个框架,

│ │ 资料,.zip

│ │

│ ├─第1章课程介绍&学习指南,

│ │ 1-1 课程介绍__ev,.mp4

│ │

│ ├─第2章 Redis入门,

│ │ 2-1 课程目录,.mp4

│ │ 2-10 Redis基本数据类型之set,.mp4

│ │ 2-11 使用Jedis对Redis进行操作,.mp4

│ │ 2-12 Redis工具类开发,.mp4

│ │ 2-2 Redis概述,.mp4

│ │ 2-3 Redis特性,.mp4

│ │ 2-4 Redis应用场景,.mp4

│ │ 2-5 Redis部署&服务启停&客户端连接,.mp4

│ │ 2-6 Redis多数据库特性,.mp4

│ │ 2-7 Redis基础命令的使用,.mp4

│ │ 2-8 Redis数据类型之string,.mp4

│ │ 2-9 Redis数据类型之list,.mp4

│ │

│ ├─第3章 HBase入门,

│ │ 3-1 数据存储现状,.mp4

│ │ 3-10 ZooKeeper环境部署,.mp4

│ │ 3-11 HBase环境部署,.mp4

│ │ 3-12 HBase shell DDL操作,.mp4

│ │ 3-13 HBase shell DML操作,.mp4

│ │ 3-14 HBase API编程之开发前置准备工作,.mp4

│ │ 3-15 HBase API编程之创建表以及查询表和所有列族,.mp4

│ │ 3-16 HBase API编程之添加和修改记录_,.mp4

│ │ 3-17 HBase API编程之通过RowKey获取值,.mp4

│ │ 3-18 HBase API编程之Scan,.mp4

│ │ 3-19 HBase API编程之Filter,.mp4

│ │ 3-2 HBase是什么,.mp4

│ │ 3-20 HBase API编程之总结,.mp4

│ │ 3-3 HBase在生态圈中的位置以及列式存储带来的好处,.mp4

│ │ 3-4 HBase的特点,.mp4

│ │ 3-5 HBase vs RDBMS vs HDFS,.mp4

│ │ 3-6 HBase的优势,.mp4

│ │ 3-7 HBase数据模型,.mp4

│ │ 3-8 JDK环境搭建,.mp4

│ │ 3-9 Hadoop环境部署(详解一个常见的错误解决方案),.mp4

│ │

│ ├─第4章离线项目实战V1,

│ │ 4-1 课程目录,.mp4

│ │ 4-10 开发环境依赖使用说明,.mp4

│ │ 4-11 功能开发之解析日志成DataFrame并为DataFrame添加字段信息,.mp4

│ │ 4-12 功能开发之将DF内容转成HBase要存储的列,.mp4

│ │ 4-13 功能开发之整体ETL流程详解及如何传参设计,.mp4

│ │ 4-14 功能开发之创建HBase表,.mp4

│ │ 4-15 功能开发之HBase Rowkey设计_1,.mp4

│ │ 4-16 功能开发之完成ETL数据到HBase落地的全过程,.mp4

│ │ 4-17 功能开发之完成第一个指标的统计分析,.mp4

│ │ 4-18 功能开发之完成第二个指标的统计分析,.mp4

│ │ 4-19 性能优化之缓存的使用,.mp4

│ │ 4-2 项目背景,.mp4

│ │ 4-20 功能开发之统计功能使用DataFrame API以及SQL API来完成,.mp4

│ │ 4-21 本章小结,.mp4

│ │ 4-3 项目处理流程,.mp4

│ │ 4-4 项目离线和实时架构图,.mp4

│ │ 4-5 明确架构图中每个步骤使用的技术以及职责所在,.mp4

│ │ 4-6 项目指标需求,.mp4

│ │ 4-7 功能开发之UserAgent解析(掌握如何获取技能),.mp4

│ │ 4-8 功能开发之IP解析思路,.mp4

│ │ 4-9 功能开发之Spark和HBase依赖整合,.mp4

│ │

│ ├─第5章离线项目实战优化,

│ │ 5-1 课程目录,.mp4

│ │ 5-10 Spark产生HFile整个流程实现并总结,.mp4

│ │ 5-2 Spark on YARN,.mp4

│ │ 5-3 Linux时间获取,.mp4

│ │ 5-4 shell封装Spark作业提交脚本,.mp4

│ │ 5-5 将统计结果写入到MySQL中,.mp4

│ │ 5-6 统计结果写入到MySQL调优,.mp4

│ │ 5-7 Spark ETL到HBase优化之禁用WAL,.mp4

│ │ 5-8 Spark ETL到HBase的HFile思路,.mp4

│ │ 5-9 Spark产生HFile文件格式准备工作,.mp4

│ │

│ ├─第6章实时项目实战,

│ │ 6-1 课程目录,.mp4

│ │ 6-10 功能实现之每天的粒度统计,.mp4

│ │ 6-11 功能开发之调优,.mp4

│ │ 6-12 功能实现小结,.mp4

│ │ 6-13 功能实现之每小时统计及代码重构,.mp4

│ │ 6-14 SparkStreaming对接Kafka offset管理,.mp4

│ │ 6-2 项目背景,.mp4

│ │ 6-3 项目架构及处理流程,.mp4

│ │ 6-4 项目需求,.mp4

│ │ 6-5 开发环境准备及参数配置统一管理,.mp4

│ │ 6-6 Kafka部署及测试,.mp4

│ │ 6-7 Mock数据,.mp4

│ │ 6-8 发送数据到Kafka,.mp4

│ │ 6-9 SparkStreaming对接Kafka数据,.mp4

│ │

│ ├─第7章初识Alluxio,

│ │ 7-1 课程目录,.mp4

│ │ 7-10 Alluxio整合MapReduce使用,.mp4

│ │ 7-11 Alluxio整合Spark使用,.mp4

│ │ 7-12 Alluxio案例分享之在百度的使用,.mp4

│ │ 7-13 Alluxio案例分享之在去哪儿的应用,.mp4

│ │ 7-2 概述,.mp4

│ │ 7-3 Spark应用存在的问题分析,.mp4

│ │ 7-4 Alluxio能为我们带来什么,.mp4

│ │ 7-5 Alluxio特点,.mp4

│ │ 7-6 在Spark实战项目中引入Alluxio,.mp4

│ │ 7-7 Alluxio部署,.mp4

│ │ 7-8 Alluxio文件系统命令行操作,.mp4

│ │ 7-9 Alluxio整合HDFS使用,.mp4

│ │

│ └─第8章 Spark优化,

│ 8-1 课程目录,.mp4

│ 8-10 调优之广播变量,.mp4

│ 8-2 调优之资源设置,.mp4

│ 8-3 调优之算子的合理选择,.mp4

│ 8-4 扩展之自定义排序一,.mp4

│ 8-5 扩展之自定义排序二(附带经典面试题),.mp4

│ 8-6 扩展之自定义排序(隐式转换),.mp4

│ 8-7 Spark Streaming调优之Kafka限速,.mp4

│ 8-8 Spark Streaming对接Kafka能真正做到仅消费一次吗,.mp4

│ 8-9 调优之序列化,.mp4

本站所有资源均来自网络，版权归原作者所有，本站仅提供收集与推荐，若侵犯到您的权益，请【给我们反馈】，我们将在24小时内处理！

下载权限

查看

￥

免费下载

评论并刷新后下载

登录后下载

查看演示

{{attr.name}}：

您当前的等级为

登录后免费下载登录小黑屋反思中，不准下载！评论后刷新页面下载评论支付以后下载请先登录您今天的下载次数（次）用完了，请明天再来支付积分以后下载立即支付支付以后下载立即支付您当前的用户组不允许下载升级会员

您已获得下载权限您可以每天下载资源次，今日剩余次

{{userData.name}}已认证

Spark实战大数据离线与实时项目整合大数据生态圈多个框架

下载权限

查看演示

怎样能更多的下载资源？/如何获取积分？

游客用户购买后未获得下载权限？

资源失效怎么办？

怎么兑换资源？

文件解压出错/解压文件不全

怎么下载资源？

资源提取码在哪？

资源解压密码在哪？

为什么有些资源没有下载入口？

我有资源内容，怎样发布供稿呢？

怎么利用关键字搜索资源？

想寻找一个站点上没有的资源怎么办？

如何保存【百度网盘】群资源？

用户协议

热销商城

免责声明

在线留言

建议提交

申请友链

广告合作

推广中心

{{userData.name}}已认证

下载权限

查看演示

2021年尚硅谷Java后端【2021年11月结课】

黑马 152小课合集

黑马博学谷-JavaEE在线就业班2022年+中级进修课+精英进阶|价值14980元|重磅首发|完结无秘

2021年尚硅谷Java大数据

用户协议

热销商城

免责声明

在线留言

建议提交

申请友链

广告合作

推广中心