黑马程序员 大数据 全网第一套PySpark-大数据开发

黑马程序员 大数据 全网第一套Pyspark-大数据开发
黑马程序员 大数据 全网第一套Pyspark-大数据开发 1

课程介绍(A000830):

黑马程序员 大数据 全网第一套PySpark-大数据开发

文件目录:

黑马程序员 大数据 全网第一套PySpark-大数据开发
│   ├─PySpark-视频
│   │   ├─0-导学视频
│   │   │   └─PySpark导学.mp4            368.43MB
│   │   ├─1-第一部分-Spark基础入门
│   │   │   ├─1-第一章
│   │   │   │   ├─01-课程导入.mp4            5.67MB
│   │   │   │   ├─Spark基础入门-第一章-1.1-Spark简单介绍.mp4            46.18MB
│   │   │   │   ├─Spark基础入门-第一章-1.2-Spark风雨十年.mp4            61.13MB
│   │   │   │   ├─Spark基础入门-第一章-1.3-Spark和Hadoop的对比.mp4            75.02MB
│   │   │   │   ├─Spark基础入门-第一章-1.4-Spark四大特点.mp4            64.85MB
│   │   │   │   ├─Spark基础入门-第一章-1.5-Spark框架模块.mp4            57.79MB
│   │   │   │   ├─Spark基础入门-第一章-1.6-Spark运行模式.mp4            59.03MB
│   │   │   │   ├─Spark基础入门-第一章-1.7-Spark的架构角色.mp4            88.17MB
│   │   │   │   └─Spark基础入门-第一章-总结.mp4            11.04MB
│   │   │   ├─2-第二章
│   │   │   │   ├─Spark基础入门-第二章-2.1-课程服务器环境.mp4            43.6MB
│   │   │   │   ├─Spark基础入门-第二章-2.2-Local模式基本原理.mp4            88.65MB
│   │   │   │   ├─Spark基础入门-第二章-2.3-在Linux上服务器上安装Anaconda.mp4            268.55MB
│   │   │   │   └─Spark基础入门-第二章-2.4-Spark Local模式部署.mp4            514.95MB
│   │   │   ├─3-第三章
│   │   │   │   ├─Spark基础入门-第三章-3.1-StandAlone的运行原理.mp4            23.39MB
│   │   │   │   ├─Spark基础入门-第三章-3.2-StandAlone部署.mp4            624.2MB
│   │   │   │   ├─Spark基础入门-第三章-3.3-StandAlone程序测试.mp4            271.91MB
│   │   │   │   ├─Spark基础入门-第三章-3.4-Spark程序运行层次划分.mp4            255.49MB
│   │   │   │   └─Spark基础入门-第三章-3.5-总结.mp4            34.76MB
│   │   │   ├─4-第四章
│   │   │   │   ├─Spark基础入门-第四章-4.1-StandAlone HA模式的运行原理.mp4            63.25MB
│   │   │   │   ├─Spark基础入门-第四章-4.2-StandAlone 部署和测试.mp4            251.35MB
│   │   │   │   └─Spark基础入门-第四章-4.3-总结.mp4            29.79MB
│   │   │   ├─5-第五章
│   │   │   │   ├─Spark基础入门-第五章-5.1-Spark On YARN的运行原理.mp4            90.03MB
│   │   │   │   ├─Spark基础入门-第五章-5.2-Spark On YARN 部署和测试.mp4            214.69MB
│   │   │   │   ├─Spark基础入门-第五章-5.3-两种部署模式的区别.mp4            100.92MB
│   │   │   │   ├─Spark基础入门-第五章-5.4-两种部署模式的演示和总结.mp4            157.93MB
│   │   │   │   ├─Spark基础入门-第五章-5.5-两种模式任务提交流程.mp4            125.57MB
│   │   │   │   └─Spark基础入门-第五章-5.6-总结.mp4            38.74MB
│   │   │   ├─6-第六章
│   │   │   │   ├─Spark基础入门-第六章-6.1-框架和类库.mp4            42.43MB
│   │   │   │   ├─Spark基础入门-第六章-6.2-PySpark类库介绍.mp4            56MB
│   │   │   │   ├─Spark基础入门-第六章-6.3-PySpark安装.mp4            156.69MB
│   │   │   │   └─Spark基础入门-第六章-6.4-总结.mp4            9.07MB
│   │   │   ├─7-第七章
│   │   │   │   ├─Spark基础入门-第七章-7.1-本机配置Python环境.mp4            189.34MB
│   │   │   │   ├─Spark基础入门-第七章-7.2-PyCharm本地和远程解释器配置.mp4            106.98MB
│   │   │   │   ├─Spark基础入门-第七章-7.3-编程入口SparkContext对象以及WordCount演示.mp4            248.97MB
│   │   │   │   ├─Spark基础入门-第七章-7.4-WordCount代码流程解析.mp4            134.6MB
│   │   │   │   ├─Spark基础入门-第七章-7.5-提交WordCount到Linux集群运行.mp4            144.23MB
│   │   │   │   └─Spark基础入门-第七章-7.6-总结.mp4            23.75MB
│   │   │   └─8-第八章
│   │   │         ├─Spark基础入门-第八章-8.1-Spark运行角色回顾.mp4            72.42MB
│   │   │         ├─Spark基础入门-第八章-8.2-分布式代码执行分析.mp4            156.84MB
│   │   │         ├─Spark基础入门-第八章-8.3-Python On Spark执行原理.mp4            135.93MB
│   │   │         └─Spark基础入门-第八章-总结.mp4            11.95MB
│   │   ├─2-第二部分-SparkCore
│   │   │   ├─1-第一章
│   │   │   │   ├─SparkCore-第一章-1.1-什么是RDD.mp4            22.11MB
│   │   │   │   ├─SparkCore-第一章-1.2-RDD五大特性-特性1.mp4            15.74MB
│   │   │   │   ├─SparkCore-第一章-1.3-RDD五大特性-特性2.mp4            61.14MB
│   │   │   │   ├─SparkCore-第一章-1.4-RDD的五大特性-特性3.mp4            26.84MB
│   │   │   │   ├─SparkCore-第一章-1.5-RDD的五大特性-特性4.mp4            42.87MB
│   │   │   │   ├─SparkCore-第一章-1.6-RDD的五大特性-特性5.mp4.mp4            53.15MB
│   │   │   │   ├─SparkCore-第一章-1.7-WordCount结合RDD特性进行执行分析.mp4            205.3MB
│   │   │   │   └─SparkCore-第一章-1.8-总结.mp4            21.49MB
│   │   │   ├─2-第二章
│   │   │   │   ├─SparkCore-第二章-1-RDD的创建-1.mp4            31.39MB
│   │   │   │   ├─SparkCore-第二章-10-RDD算子-filter.mp4            37.06MB
│   │   │   │   ├─SparkCore-第二章-11-RDD算子-distinct.mp4            53.73MB
│   │   │   │   ├─SparkCore-第二章-12-RDD算子-union.mp4            31.62MB
│   │   │   │   ├─SparkCore-第二章-13-RDD算子-join.mp4            86.96MB
│   │   │   │   ├─SparkCore-第二章-14-RDD算子-intersection.mp4            29.46MB
│   │   │   │   ├─SparkCore-第二章-15-RDD算子-glom.mp4            9.26MB
│   │   │   │   ├─SparkCore-第二章-16-RDD算子-groupByKey.mp4            55.64MB
│   │   │   │   ├─SparkCore-第二章-17-RDD算子-sortBy.mp4            100.83MB
│   │   │   │   ├─SparkCore-第二章-18-RDD算子-sortByKey.mp4            78.44MB
│   │   │   │   ├─SparkCore-第二章-19-RDD算子-案例.mp4            146.47MB
│   │   │   │   ├─SparkCore-第二章-2-RDD的创建-2.mp4            210.02MB
│   │   │   │   ├─SparkCore-第二章-20-RDD算子-案例-提交到YARN执行.mp4            340.44MB
│   │   │   │   ├─SparkCore-第二章-21-RDD算子-countByKey.mp4            58.4MB
│   │   │   │   ├─SparkCore-第二章-22-RDD算子-reduce.mp4            53.11MB
│   │   │   │   ├─SparkCore-第二章-23-RDD算子-fold.mp4            57.46MB
│   │   │   │   ├─SparkCore-第二章-24-RDD算子-take-first-count-top.mp4            41.78MB
│   │   │   │   ├─SparkCore-第二章-25-RDD算子-takeSample.mp4            73.94MB
│   │   │   │   ├─SparkCore-第二章-26-RDD算子-takeOrdered.mp4            40.16MB
│   │   │   │   ├─SparkCore-第二章-27-RDD算子-foreach.mp4            72.47MB
│   │   │   │   ├─SparkCore-第二章-28-RDD算子-saveAsTextFile.mp4            118.39MB
│   │   │   │   ├─SparkCore-第二章-29-RDD算子-mapPartitions.mp4            86.75MB
│   │   │   │   ├─SparkCore-第二章-3-RDD算子概念和分类.mp4            67.11MB
│   │   │   │   ├─SparkCore-第二章-30-RDD算子-foreachPartition.mp4            37.86MB
│   │   │   │   ├─SparkCore-第二章-31-RDD算子-partitionBy.mp4            74.59MB
│   │   │   │   ├─SparkCore-第二章-32-RDD算子-repartition-coalesce.mp4            95.14MB
│   │   │   │   ├─SparkCore-第二章-33-RDD算子-面试题-groupByKey和reduceByKey的区别.mp4            56.5MB
│   │   │   │   ├─SparkCore-第二章-34-总结.mp4            10.35MB
│   │   │   │   ├─SparkCore-第二章-4-转换算子-map.mp4            104.95MB
│   │   │   │   ├─SparkCore-第二章-5-转换算子-flatMap.mp4            56.42MB
│   │   │   │   ├─SparkCore-第二章-6-转换算子-reduceByKey.mp4            21.36MB
│   │   │   │   ├─SparkCore-第二章-7-RDD算子-mapValues.mp4            40.74MB
│   │   │   │   ├─SparkCore-第二章-8-WordCount案例回顾.mp4            53.72MB
│   │   │   │   └─SparkCore-第二章-9-RDD算子-groupBy.mp4            81.39MB
│   │   │   ├─3-第三章
│   │   │   │   ├─SparkCore-第三章-1-RDD的数据是过程数据概念.mp4            52.26MB
│   │   │   │   ├─SparkCore-第三章-2-RDD的缓存.mp4            323.24MB
│   │   │   │   ├─SparkCore-第三章-3-RDD的CheckPoint.mp4            138.09MB
│   │   │   │   └─SparkCore-第三章-4-总结.mp4            20.77MB
│   │   │   ├─4-第四章
│   │   │   │   ├─SparkCore-第四章-1-jieba库入门使用.mp4            146.29MB
│   │   │   │   ├─SparkCore-第四章-2-案例需求1开发.mp4            373.43MB
│   │   │   │   ├─SparkCore-第四章-3-案例需求2开发.mp4            227.51MB
│   │   │   │   ├─SparkCore-第四章-4-案例需求3开发.mp4            140.39MB
│   │   │   │   ├─SparkCore-第四章-5-提交代码到YARN集群运行.mp4            153.12MB
│   │   │   │   └─SparkCore-第四章-6-作业和总结.mp4            8.88MB
│   │   │   ├─5-第五章
│   │   │   │   ├─SparkCore-第五章-1-广播变量.mp4            354.61MB
│   │   │   │   ├─SparkCore-第五章-2-累加器.mp4            213.12MB
│   │   │   │   ├─SparkCore-第五章-3-广播变量累加器综合案例.mp4            287.43MB
│   │   │   │   └─SparkCore-第五章-4-总结.mp4            3.17MB
│   │   │   └─6-第六章
│   │   │         ├─SparkCore-第六章-1-DAG.mp4            86.26MB
│   │   │         ├─SparkCore-第六章-2-宽窄依赖和阶段划分.mp4            73.07MB
│   │   │         ├─SparkCore-第六章-3-内存迭代计算.mp4            217.51MB
│   │   │         ├─SparkCore-第六章-4-Spark并行度.mp4            86.48MB
│   │   │         ├─SparkCore-第六章-5-Spark任务调度.mp4            168.34MB
│   │   │         ├─SparkCore-第六章-6-Spark运行概念名词解释和层级梳理.mp4            90.16MB
│   │   │         └─SparkCore-第六章-7-总结.mp4            14.97MB
│   │   ├─3-第三部分-SparkSQL
│   │   │   ├─1-第一章
│   │   │   │   └─SparkSQL-第一章-SparkSQL基础入门.mp4            32.28MB
│   │   │   ├─2-第二章
│   │   │   │   ├─SparkSQL-第二章-1-SparkSQL和Hive的异同以及SparkSQL的数据抽象.mp4            141.3MB
│   │   │   │   ├─SparkSQL-第二章-2-SparkSession执行环境入口构建和SparkSQL HelloWorld.mp4            142.14MB
│   │   │   │   └─SparkSQL-第二章-3-总结.mp4            5.56MB
│   │   │   ├─3-第三章
│   │   │   │   ├─SparkSQL-第三章-1-DataFrame对象的构成.mp4            18.96MB
│   │   │   │   ├─SparkSQL-第三章-10-DSL风格入门API.mp4            200.05MB
│   │   │   │   ├─SparkSQL-第三章-11-SQL风格入门API.mp4            73.21MB
│   │   │   │   ├─SparkSQL-第三章-12-WordCount案例.mp4            216.29MB
│   │   │   │   ├─SparkSQL-第三章-13-电影评分案例编程.mp4            530.2MB
│   │   │   │   ├─SparkSQL-第三章-14-SparkSQL Shuffle阶段分区数参数设定.mp4            108.97MB
│   │   │   │   ├─SparkSQL-第三章-15-异常数据处理API.mp4            300.02MB
│   │   │   │   ├─SparkSQL-第三章-16-DataFrame数据写出.mp4            153.07MB
│   │   │   │   ├─SparkSQL-第三章-17-DataFrame使用JDBC协议读写数据库(MySQL).mp4            176.64MB
│   │   │   │   ├─SparkSQL-第三章-18-总结.mp4            9.53MB
│   │   │   │   ├─SparkSQL-第三章-2-DataFrame创建-1.mp4            194.59MB
│   │   │   │   ├─SparkSQL-第三章-3-DataFrame创建-2.mp4            92.99MB
│   │   │   │   ├─SparkSQL-第三章-4-DataFrame创建-3.mp4            64.56MB
│   │   │   │   ├─SparkSQL-第三章-5-DataFrame创建-4-基于Pandas的DF转换为SparkSQL的DF对象.mp4            6.96MB
│   │   │   │   ├─SparkSQL-第三章-6-标准API读取text数据源构建DataFrame.mp4            69.29MB
│   │   │   │   ├─SparkSQL-第三章-7-标准API读取json构建DataFrame.mp4            32.21MB
│   │   │   │   ├─SparkSQL-第三章-8-标准API读取jcsv构建DataFrame(1).mp4            50.8MB
│   │   │   │   ├─SparkSQL-第三章-8-标准API读取jcsv构建DataFrame.mp4            50.8MB
│   │   │   │   └─SparkSQL-第三章-9-标准API读取jparquet构建DataFrame.mp4            65.29MB
│   │   │   ├─4-第四章
│   │   │   │   ├─SparkSQL-第四章-1-UDF创建演示.mp4            228.18MB
│   │   │   │   ├─SparkSQL-第四章-2-注册返回值是数组类型的UDF.mp4            131.32MB
│   │   │   │   ├─SparkSQL-第四章-3-返回字典类型的UDF定义.mp4            145.4MB
│   │   │   │   ├─SparkSQL-第四章-4-拓展-通过RDD代码模拟UDAF效果.mp4            101.6MB
│   │   │   │   ├─SparkSQL-第四章-5-窗口函数的演示.mp4            170.8MB
│   │   │   │   └─SparkSQL-第四章-6-总结.mp4            4.74MB
│   │   │   ├─5-第五章
│   │   │   │   ├─SparkSQL-第五章-1-Catalyst优化器.mp4            54.68MB
│   │   │   │   └─SparkSQL-第五章-2-SparkSQL执行流程及本章总结.mp4            42.14MB
│   │   │   ├─6-第六章
│   │   │   │   └─SparkSQL-第六章-SparkOnHive原理和配置及总结.mp4            334.22MB
│   │   │   └─7-第七章
│   │   │         └─SparkSQL-第七章-分布式SQL的执行引擎原理和配置.mp4            309.39MB
│   │   ├─4-第四部分-案例
│   │   │   ├─案例-案例背景及需求1开发.mp4            81.98MB
│   │   │   ├─案例-需求2开发.mp4            411.11MB
│   │   │   ├─案例-需求3开发.mp4            71.42MB
│   │   │   └─案例-需求4开发.mp4            235.69MB
│   │   └─5-第五部分-Spark新特性及核心回顾
│   │         ├─Spark新特性及核心回顾-1-1-HashShuffleManager.mp4            101.99MB
│   │         ├─Spark新特性及核心回顾-1-2-SortShuffleManager.mp4            86.46MB
│   │         ├─Spark新特性及核心回顾-1-3-总结.mp4            18.48MB
│   │         ├─Spark新特性及核心回顾-2-1-3.0新特性-AQE.mp4            176.45MB
│   │         ├─Spark新特性及核心回顾-2-2-新特性-动态分区裁剪.mp4            47.1MB
│   │         ├─Spark新特性及核心回顾-2-3-新特性-koalas库.mp4            303.84MB
│   │         ├─Spark新特性及核心回顾-2-4-总结.mp4            24.25MB
│   │         └─Spark新特性及核心回顾-3-Spark概念总结.mp4            60.94MB
│   └─PySpark-资料
│         ├─PPT
│         │   ├─1 – Spark基础入门.pdf            6.45MB
│         │   ├─2 – Spark核心编程.pdf            6.92MB
│         │   ├─3 – SparkSQL.pdf            7.08MB
│         │   ├─4 – Spark综合案例.pdf            819.04KB
│         │   └─5 – Spark核心回顾+新特性.pdf            2.51MB
│         ├─代码.zip            19.52MB
│         ├─完整虚拟机2021-SZ
│         │   ├─2021新版本软件安装v520211002192.168.88.2安装Spark-NoSQL-Flink.docx            15.39MB
│         │   ├─centos20211005.zip.001            7.96GB
│         │   ├─centos20211005.zip.002            7.96GB
│         │   ├─centos20211005.zip.003            7.96GB
│         │   ├─centos20211005.zip.004            7.96GB
│         │   ├─centos20211005.zip.005            5.66GB
│         │   ├─大数据环境统一虚拟机
│         │   │   ├─文档
│         │   │   │   ├─01-安装VMware虚拟机.doc            638KB
│         │   │   │   ├─02-虚拟机安装.doc            2.02MB
│         │   │   │   ├─03-CRT连接linux.doc            1.05MB
│         │   │   │   ├─04-vmware软件卸载.doc            578KB
│         │   │   │   ├─05-大数据环境配置统一.doc            3.12MB
│         │   │   │   ├─06-zookeeper集群安装.doc            138.5KB
│         │   │   │   ├─07-hadoop集群安装操作.doc            287.5KB
│         │   │   │   ├─08-hive安装操作.doc            154KB
│         │   │   │   ├─09-spark部署文档.doc            2.47MB
│         │   │   │   ├─10-HBase安装操作.docx            203.36KB
│         │   │   │   ├─11-Phoenix的安装操作.doc            359.5KB
│         │   │   │   ├─12-kafka环境搭建.docx            89.1KB
│         │   │   │   ├─13-flume安装以及nosql综合案例环境.doc            86.5KB
│         │   │   │   └─14-flink集群安装.doc            3.9MB
│         │   │   ├─虚拟机
│         │   │   │   ├─node1.zip            11.21GB
│         │   │   │   ├─node2.zip            8.72GB
│         │   │   │   └─node3.zip            7.58GB
│         │   │   └─资料.zip            9.1GB
│         │   ├─说明1:1-7快照截图.jpg            26.3KB
│         │   └─说明2.txt            192B
│         └─资料
│               ├─Anaconda3-2021.05-Linux-x8664.sh            544.41MB
│               ├─Anaconda3-2021.05-Windows-x8664.exe            477.2MB
│               ├─apache-hive-3.1.2-bin.tar.gz            265.9MB
│               ├─DAG 和 Action.drawio            2.3KB
│               ├─hadoop-3.3.0
│               │   └─bin
│               │         ├─hadoop.dll            85KB
│               │         ├─hadoop.exp            19.3KB
│               │         ├─hadoop.lib            32.46KB
│               │         ├─hadoop.pdb            684KB
│               │         ├─libwinutils.lib            1.25MB
│               │         ├─winutils.exe            110KB
│               │         └─winutils.pdb            1.13MB
│               ├─hadoop-3.3.1.tar.gz            577.15MB
│               ├─jdk-8u211-linux-x64.tar.gz            185.96MB
│               ├─mysql-connector-java-5.1.41-bin.jar            969.54KB
│               ├─mysql-connector-java-8.0.13.jar            2.03MB
│               ├─pyarrow-4.0.1-cp38-cp38-manylinux2014x8664.whl            20.87MB
│               ├─Spark On YARN Client模式.drawio            2.12KB
│               ├─Spark On YARN Cluster模式.drawio            1.98KB
│               ├─spark-3.2.0-bin-hadoop3.2.tgz            287.02MB
│               ├─Spark层次关系概念图.png            118.54KB
│               ├─Spark核心概念.png            724.93KB
│               ├─Spark核心概念.xmind            746.76KB
│               ├─Spark部署文档.md            28.93KB
│               ├─WordCount代码执行的图示.drawio            2.27KB
│               └─测试数据
│                     ├─accumulatorbroadcastdata.txt            212B
│                     ├─apache.log            1.41KB
│                     ├─mini.json            118.62MB
│                     ├─minimini.json            1.17MB
│                     ├─order.text            2.84KB
│                     ├─SogouQ.txt            1.34MB
│                     ├─sql
│                     │   ├─helloworld.txt            37B
│                     │   ├─people.csv            188B
│                     │   ├─people.json            73B
│                     │   ├─people.txt            32B
│                     │   ├─stuscore.txt            1.2KB
│                     │   ├─u.data            1.89MB
│                     │   ├─user.avsc            185B
│                     │   ├─users.avro            334B
│                     │   ├─users.orc            547B
│                     │   └─users.parquet            615B
│                     ├─stuinfo.txt            331B
│                     ├─stuscore.txt            1.2KB
│                     ├─tinyfiles
│                     │   ├─1.txt            38B
│                     │   ├─2.txt            38B
│                     │   ├─3.txt            38B
│                     │   ├─4.txt            38B
│                     │   └─5.txt            38B
│                     └─words.txt            38B

本站所有资源均来自网络,版权归原作者所有,本站仅提供收集与推荐,若侵犯到您的权益,请【给我们反馈】,我们将在24小时内处理!

下载权限

查看
  • 免费下载
    评论并刷新后下载
    登录后下载

查看演示

  • {{attr.name}}:
您当前的等级为
登录后免费下载登录 小黑屋反思中,不准下载! 评论后刷新页面下载评论 支付以后下载 请先登录 您今天的下载次数(次)用完了,请明天再来 支付积分以后下载立即支付 支付以后下载立即支付 您当前的用户组不允许下载升级会员
您已获得下载权限 您可以每天下载资源次,今日剩余

给TA打赏
共{{data.count}}人
人已打赏
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索