极客时间 Spark核心原理与实战60讲完结百度网盘

名师简介:

王磊老师是《offer 来了:Java 面试核心知识点精讲. 原理篇》&《offer 来了:Java 面试核心知识点精讲. 架构篇》两本书的作者,并且有着十余年丰富的物联网、大数据研发以及技术架构经验,对物联网及大数据的原理和技术实现有着深刻理解。长期从事海外项目的研发和交付工作,对异地多活数据中心的建设及高可用、高并发系统的设计,有丰富的实战经验。

目录:

极客时间 Spark核心原理与实战60讲完结百度网盘

01-课程介绍.mp4

02-内容综述.mp4

03-Spark简介及生态介绍.mp4

04-Spark原理及特点:模块概述+特点.mp4

05-Spark原理及特点:运行模式+集群组角色.mp4

06-Spark原理及特点:Spark作业运行流程.mp4

07-Spark的运行环境安装:Standalone入门实战.mp4

08-Spark的运行环境安装:YARN入门实战.mp4

09-Spark批处理做作业入门Demo.mp4

10-Spark流处理做作业入门Demo.mp4

11-SparkRDD原理:RDD抽象及相关概念.mp4

12-SparkRDD原理:RDD依赖关系、Stage、RDD持久化、SparkPreferredLocation及CheckPoint原理和使用.mp4

13-SparkRDD实战:如何利用外部数据集生成RDD?.mp4

14-SparkRDD实战:Transformation和Action概念、LazyLoad及SparkFunction的3种实现方式.mp4

15-SparkRDD实战:常用Transformation原理及实战.mp4

16-SparkRDD实战:Action原理和实战、Spark广播变量原理和使用.mp4

17-SparkSQL、DataFrame、DataSet原理和使用.mp4

18-SparkSQLJoin操作及SparkSQLFunction.mp4

19-SparkSQL原理和执行过程.mp4

20-常用数据格式原理和使用:TEXT、CSV、JSON、PARQUET在Spark中的使用.mp4

21-常用数据格式原理和使用:ORC、AVRO在Spark中的使用.mp4

22-SparkConnecter:HDFS及HBase.mp4

23-SparkConnecter:MongoDB.mp4

24-SparkConnecter:Cassandra.mp4

25-SparkConnecter:MySQL及Kafka.mp4

26-SparkConnecter:ElasticSearch.mp4

27-SparkStearming原理及实战:创建一个SparkStreaming应用.mp4

28-SparkStearming原理及实战:DStream操作、数据持久化及性能优化.mp4

29-SparkStructuredStearming原理及实战:StructuredStreaming概念、特点、数据模型和应用实战.mp4

30-SparkStructuredStearming原理及实战:StructuredStearming事件时间、延迟数据处理策略、容错语义和编程模型.mp4

31-SparkStructuredStearming原理及实战:StructuredStearming时间窗口操作、水位线和数据更新模式.mp4

32-SparkStructuredStearming原理及实战:StreamJoin操作、重复数据处理、多Watermark处理策略、StructuredStearming结果输出.mp4

33-Spark文件读写原理.mp4

34-内存调优:JVM内存调优、堆外内存设置及storageFraction设置.mp4

35-任务调优:Executor数量内存及CPU配置、设置合理的并行度、Task等待时长调优、Blacklisting调优.mp4

36-失败重试与黑名单机制、推测式执行、资源申请机制.mp4

37-SparkOnYARN:Client模式与Cluster模式.mp4

38-SparkOnYARN:FIFOScheduler、CapacityScheduler原理和使用.mp4

39-SparkOnYARN:YARNFairScheduler原理、使用及特点.mp4

40-Spark文件读写原理.mp4

41-内存调优:JVM内存调优、堆外内存设置及storageFraction设置.mp4

42-任务调优:Executor数量内存及CPU配置、设置合理的并行度、Task等待时长调优、Blacklisting调优.mp4

43-数据调优:数据本地性、复用RDD、BroadCast、Kryo序列化和CheckPoint.mp4

44-算子调优.mp4

45-SparkSQL调优和SparkStreaming调优.mp4

46-Spark数据倾斜问题处理.mp4

47-Spark机器学习概述:机器学习应用场景、分类和常用算法.mp4

48-机器学习流程:数据收集与存储、数据清理与转换.mp4

49-机器学习流程:模型训练、模型测试、模型部署与整合、模型监控与反馈及数据探索和可视化.mp4

50-Spark常用统计方法:基础统计、相关性分析、数据抽样.mp4

51-分类模型:概念与种类、线性回归及逻辑回归原理实现.mp4

52-分类模型:朴素贝叶斯原理实现、决策树原理实现及协同过滤原理.mp4

53-聚类模型:基于K-Means的聚类算法原理实现.mp4

54-MLPipLine:如何通过SparkMLPipLine模式实现模型训练?.mp4

55-Spark3.0新特性概述.mp4

56-Spark未来趋势:为什么需要数据湖?.mp4

57-Spark未来趋势:DeltaLake原理.mp4

58-Spark未来趋势:DeltaLake实战.mp4

59-Spark应用番外篇:大数据任务调度.mp4

60-结束语.mp4

资料地址.txt

0
分享到:

评论0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址