第一阶段
基础语法
出使Python国
Python简介和历史
Python优缺点
Python能做什么
print函数
Python环境搭建
PyCharm安装及使用
七十二变
变量是什么
变量命名方式
标识符有哪些
数据类型概述
数据类型
数值类型
数据类型转换
注释
算你赢
input函数
算术运算符
赋值运算符
比较运算符
布尔运算符
位运算符
运算符的优先级
往哪走
组织结构
顺序结构
对象的布尔值
分支结构
if-else
pass语句
条件表达式
if嵌套
转圈圈
range函数
循环结构
循环的分类
while循环
for循环
break
continue
for-else
嵌套循环
一字排开
列表介结
列表特点
创建List
List的索引
列表的切片
修改和新增
排序
列表推导式
夫妻站
字典
创建dict
字典的操作
zip函数
字典遍历
新增
删除
修改
字典生成式
是排还是散
元组介绍
元组的遍历
创建tuple
集合
创建set
集合的增、删、改、查操作,可变对象与不可变对象,集合生成式
一串连一串
字符串的内存机制
常用操作
字符串比较
字符串切片
格式化字符串
字符串编码转换
字符串函数
水晶球不调不动
函数介绍
函数定义和调用
函数的参数
函数的返回值
变量作用域
递归函数
默认值参数
全民来找茬
Bug的由来
Bug分类
异常处理机制
tyr-except-finally
多个异常
异常的类型
异常解决方式
找对象
面向对象
面向过程
类
对象
类属性
类方法
静态方法
实例方法
创建实例
属性的修饰符
接着找对象
封装
继承
多态
方法重写
object为
__init__方法
__new__方法
百宝箱-模块
模块介绍
自定义模块
导入模块
内置模块
package
导入包
安装第三方模块
主函数运行
文件
文件编码
文件读写
文件类型
open函数
文件读写
with语句
os模块,os.path模块
大显身手
学生管理系统需求分析
系统设计
主函数设计
模块设计
排序模块设计
项目打包
项目运行
第二阶段
Linux与高并发
什么是大数据
大数据概述及课程概述
机器学习与深度学习概述
Linux环境
Linux概述
云存储与虚似机
Linux安装
Linux目录介绍
路径
Linux环境配置
Linux入门命令
Linux常用命令
常用命令
路径问题
增删查看文件
编辑文件
设置时区
启动络
修改网络
快照与克隆
XShell安装与使用
文件解压缩解归档
上传与下载
Linux高阶用法
Yum软件包管理
配置服务器
Shell脚本概述
脚本中bash
常用IO操作
变量与数组
算术表达式
逻辑判断
循环
高并发与高可用
Nginx高并发由来
Nginx与Tengine安装与配置
Nginx工作原理
皮质文件详解
正向代理与反向代理
Ngix反向代理与负载均衡
会话问题
动静分离
服务器宕机问题
Nginx+Keepalived的高可用
高可用配置
第三阶段
Zookeeper
Zookeeper初级
Zookeeper架构与概述
paxos协议
分布式编程常见问题
信息安全
Zookeeper集群
分布式集群实战
集群特点
节点
API实战
原生RMIK
Zookeeper实现RMI代码剖析
数据结构
客户端命令行操作
会话
事件监听原理
广播
集群特点
API实战
项目搭建
连接创建与关闭
节点
获取数据与验证连接转移
注册watcher监听
判断
Watcher使用
子节点查询
第四阶段
Hadoop生态体系
Hadoop基础
Hadoop生态环境概述
Hadoop的位置与关系
Hadoop应用案例介绍
Hadoop概念版本及历史
Hadoop核心组成
Hadoop生态圈结构
YARN
Yarn概述
组成结构与任务过程
yarn调度器
资源管理和任务调度
mr1优缺点
客户端提交应用
yarn的调度器
HDFS
HDFS伪分布式
命令管理
HDFS-SHELL
WEB U 查看
HDFS存储模型
HDFS架构模型
HDFS-Fedration机制
HDFS读写流程
HDFS中心缓存
完全分布式
HA
CacheAdmin
快照
内部快照管理机制
快照使用
副本放置策略
BlockToken认证
MapReduce
MapReduce概述
shuffle
MR执行流程
RM高可用
WC演示
wordcount开发
数据倾斜
排序
分析
圆形缓冲区
Map总结
reduce
MR1/2
Weather类
SortComparator_Mappe
需求分析
tfidf-MR1
tfidf-MR2-MR3
ItemCF01
Hive
Hive-SQL概述
SQL语法
表的增删改查
分区
运算符
函数
动态分区
分桶
参数与函数
视图与索引
优化
Hbase
Hbase概述
架构设计
数据模型
Hbase安装
API
表设计
Hbase与MapReuce
LSM存储结构
表设计优化
写表优化
读表优化
Flume
概述与安装
原理与Source源配置
Sink配置
Channel配置
HighAvailable
Sqoop
Sqoop介绍安装
导入HDFS
导入Hbase
导入Hive
导出
Sqoop查询语句到HDFS
导出配置
数据库配置
Cloudera
安装与配置
CM、CMS进阶使用
对比
架构原理及CLI实战及调优
部署及Hue操作数据
Oozie与DataFlowCDF
第五阶段
数据优化
Kafka
框架概述及角色讲解
部署配置
底层原理剖析
数据可靠性
场景案例与整合专题
分布式消息系统介绍
应用场景
生产消息原理
存储消息原理
版本更改对比
Redis
Redis概述及安装
Redis的字符串类型
Redis的哈希
Redis的列表类型
Redis的集合类型
持久化
Redis事务
Redis的管道
Redis优化
哨兵与集群
主从复制
Kylin
数据分析OLAP
Kylin原理基本配置
Cube构建及配置
SQL实现
Cube算法构建及优化
Kylin实时处理计算技术
第六阶段
Spark-计算体系
Spark概述
Spark概述及基础
Spark与MapReduce
Spark集群
RDD五大特性与数据本地化
算子
Standalone集群架构
Cache及persist持久化算子
Checkpointing持久化算子
Spark核心
Transformation类
Action类
Spark任务
持久化
Spark集群搭建
客户端搭建
任务提交
算子操作
算子代码
RDD依赖关系
Stage原理
Spark资源调度与任务调度
任务调度的重试机制
Spark Transformation算子
Spark Java代码
Spark PV与UV
Spark核心源码
Master注册与启动
Spark Submit提交
Spark源码申请
Spark资源调度结论验证
Shuffle机制
任务调度源码分析
二次排序
Spark分组取TOPN
广播变量+累加器
Spark服务器配置
MasterHA
ShuffleManager管理机制
Shuffle源码与SQL
Shuffle文件寻址
Shuffle过程
Spark SQL及读取JSON数
SQL
Shuffle文件寻址
Shuffle过程
Spark SQL及读取JSON数据
读取RDD加载DataFrame
Parquet/MySQL/Spark
SparkSQL操作Hive
函数与版本整合
UDF与UDAF
OVER开窗函数
SparkSteaming处理数据
SparkStreaming
SparkSteaming算子
DiverHA
Kafka01与Kafka02
SparkSteaming与Kafka
Direct手动维护Offset
Spark-streaming
Spark项目
介绍项目及数据导入
信息统计
优化
转化及实时信息统计
第七阶段
Flink实时计算
Flink基础
Flink架构原理
区别
编程模型
数据流
窗口与时间
状态详解
容错检查原理
状态与容错
Flink进阶
Checkpointing机制与使用
任务与算子链
Flink-TaskManager
Flink-JobManager
Flink-DataStream Api
合适的state backend
数据栏
整合
Flink高级
Table API及SQL查询使用
网页排名案例
Flink集群管理
Standalone模式
基于Yarn模式部署
保存点
任务槽额资源
第八阶段
项目实战
项目实战一
互联网个性实时推荐系统
项目实战
数据融合技术
数据存储技术
分布式计算技术
协同过滤算法
逻辑回归算法
模型评估
微服务
项目实战二
阿里巴巴中台实战
项目实战
前端后端
平台与平台群
资产映射血统标签化
基于中台的商品系统
基于中台的交易系统
基于中台的类目搜索系统
业务中台
数据中台
技术中心
是否实现中台辩证
第九阶段
大数据精讲
大数据精讲
大数据与机器学习的理解
大数据面试题精讲