课程介绍
课程章节
章节1:Linux面试题 (15节)

课时01

01-查找某文件或某文件夹中文件是否包含指定内容

5分48秒

课时02

02-查找以a开头的文件

3分42秒

课时03

03-如何替换文件中的某个字符串为指定内容?

8分42秒

课时04

04-查找文件并替换内容

5分56秒

课时05

05-Linux命令获取文档内容

4分30秒

课时06

06-Linux中如何获取上一条命令是否执行成功?

6分10秒

课时07

07-Linux脚本如何一次获取全部参数?

6分3秒

课时08

08-Linux中如何查看某个端口是否被占用?

5分22秒

课时09

09-如何查看Linux节点某服务的进程号?

3分28秒

课时10

10-如何查看systemctl系统命令启动服务日志?

4分39秒

课时11

11-Linux查看节点资源使用情况命令

6分35秒

课时12

12-Linux特殊内容替换

6分56秒

课时13

13-为hadoop用户赋予root权限该如何操作?

6分21秒

课时14

14-如何查看Linux系统版本

1分48秒

课时15

15-列举linux Shell中常用的命令?

3分54秒

章节2:HDFS面试题 (26节)

课时16

01-介绍HDFS架构原理

13分29秒

课时17

02-fsimage和editslog合并流程

7分31秒

课时18

03-HDFS 为什么Block块默认128M

6分36秒

课时19

04-HDFS中Block副本存储策略?

3分34秒

课时20

05-HDFS文件读写流程

8分8秒

课时21

06-HDFS中常用的命令

2分49秒

课时22

07-NameNode HA 实现原理?

33分27秒

课时23

08-NameNode HA 主备切换流程

5分17秒

课时24

09-HDFS HA中如何防止脑裂问题的?

14分47秒

课时25

10-HDFS小文件处理

24分51秒

课时26

11-HDFS NameNode元数据丢失如何处理

7分40秒

课时27

12-HDFS DataNode数据丢失如何处理

15分21秒

课时28

13-HDFS 纠删码原理、策略及优缺点

21分59秒

课时29

14-HDFS异构存储类型及存储策略

14分19秒

课时30

15-HDFS DataNode动态扩缩容步骤

14分52秒

课时31

16-HDFS数据迁移场景及实现

19分47秒

课时32

17-NameNode源码启动流程

38分6秒

课时33

18-DataNode 源码启动流程

59分35秒

课时34

19-HDFS数据上传源码流程

1小时28分30秒

课时35

20-HDFS数据读取源码流程

34分27秒

课时36

21-HDFS中误删文件如何找回?

16分37秒

课时37

22-HDFS如何保证数据的高可用?

8分35秒

课时38

23-解释HDFS一致性语义?

8分34秒

课时39

24-查看HDFS某个文件的前两行数据

2分1秒

课时40

25-Hadoop常见端口有哪些?

3分41秒

课时41

26-解释CAP理论

28分52秒

章节3:MapReduce面试题 (15节)

课时42

01-介绍MapReduce及其优缺点

20分6秒

课时43

02-MapReduce编程思想及原理?

24分21秒

课时44

03-MapReduce处理数据流程?

17分18秒

课时45

04-MapReduce Shuffle过程

19分18秒

课时46

05-MR中三次排序是哪三次

33秒

课时47

06-MR中Combiner是什么

12分12秒

课时48

07-MR处理数据支持哪些压缩格式?

6分55秒

课时49

08-MR Split切分源码

28分27秒

课时50

09-MR Map Task运行源码流程

48分3秒

课时51

10-MR Reduce Task运行源码流程

40分46秒

课时52

11-MR如何设置MapTask和ReduceTask数量?

7分12秒

课时53

12-MR中如何处理数据倾斜问题?

10分7秒

课时54

13-一行数据被切分到两个Block,MR读取时如何保证这行数据完整的?

8分35秒

课时55

14-解释MapReduce中JVM重用机制

5分22秒

课时56

15-MR中job和tasks之间的区别是什么?

4分4秒

章节4:Yarn面试题 (6节)

课时57

01-Yarn资源管理平台架构?

8分7秒

课时58

02-Yarn任务运行流程

5分39秒

课时59

03-Yarn常用命令有哪些?

29分19秒

课时60

04-Yarn核和内存相关参数有哪些?

14分25秒

课时61

05-介绍Yarn中资源调度器及各类调度器特点

21分31秒

课时62

06-介绍Yarn的容错机制

11分9秒

章节5:SQL面试题 (39节)

课时63

1.查询不相交数据集

5分23秒

课时64

2.表关联查询

11分21秒

课时65

3.SQL统计利息

24分53秒

课时66

4.SQL统计最大消费金额

18分6秒

课时67

5.SQL开窗求和统计

6分16秒

课时68

6.SQL多方式统计累计时长

15分1秒

课时69

7.获取状态变化的数据

17分46秒

课时70

8.SQL统计多日用户留存

17分48秒

课时71

9.行列变换操作

37分42秒

课时72

10.多行转一行SQL转换

1分35秒

课时73

11.SparkSQL-用户在线指标统计

59分19秒

课时74

12.SQL多维查询

19分46秒

课时75

13.统计连续登录用户数

21分26秒

课时76

14.统计每天次日留存用户数

4分10秒

课时77

15.行列变换分类统计数据

8分18秒

课时78

16.SQL数据转换操作

20分16秒

课时79

17.用户多信息SQL统计

57分17秒

课时80

18-统计用户次日留存率

25分28秒

课时81

19.统计满足指标要求的城市

2分3秒

课时82

20.统计各行业月销售额

55分23秒

课时83

21-SQL多行转换

13分52秒

课时84

22.行转列

23分40秒

课时85

23.列转行

13分51秒

课时86

24.Json数据处理

6分58秒

课时87

25.jsonArray处理

14分34秒

课时88

26.SQL时间转换

6分41秒

课时89

27.时间转换用户留存数统计

21分42秒

课时90

28.Hive实现循环

13分42秒

课时91

29.SQL统计工资排名

9分8秒

课时92

30.HQL实现找出变化的行

12分3秒

课时93

31.HQL实现VPN用户在线指标分析

49分40秒

课时94

32.连续3日登录用户统计

14分30秒

课时95

33.用户最大活跃天数统计

33分53秒

课时96

34.间隔天连续登录统计

14分17秒

课时97

35.if综合使用查询

15分10秒

课时98

36.多条件统计

7分1秒

课时99

37-SQL面试题 - 实现好友推荐-01-需求

2分21秒

课时100

37-SQL面试题 - 实现好友推荐-02-分析

19分6秒

课时101

37-SQL面试题 - 实现好友推荐-03-实现

5分5秒

章节6:Scala面试题 (13节)

课时102

01-Scala eq 和 equals方法区别

4分2秒

课时103

02-Scala类型层次结构?

3分58秒

课时104

03-Scala中Class和Object区别?

3分58秒

课时105

04-Scala中equals、==、eq区别?

5分17秒

课时106

05-Scala中什么是尾递归?

11分0秒

课时107

06-Scala中Trait与抽象类区别?

3分6秒

课时108

07-Scala中继承抽象类和Trait问题

7分39秒

课时109

08-介绍Scala闭包

4分3秒

课时110

09-按要求实现Scala高阶函数

1分56秒

课时111

10-Scala中asInstanceOf与cast区别?

4分38秒

课时112

11-介绍下Scala中隐式转换

6分49秒

课时113

12-按要求实现函数功能

3分49秒

课时114

13-Scala如何实现并发编程?

7分10秒

章节7:Spark面试题 (25节)

课时115

手写Scala Spark WordCount

53秒

课时116

谈谈Spark核心RDD理解,RDD有哪些缺陷?

10分33秒

课时117

Spark算子举例

4分32秒

课时118

groupByKey与reduceByKey的区别?

10分54秒

课时119

RDD如何实现容错?基本原理是什么?

17分59秒

课时120

Spark Application、Job、Stage、Task有什么关系

4分56秒

课时121

有哪些因素影响Stage中的Task个数?

20秒

课时122

Spark资源调度和任务调度流程?

17分30秒

课时123

介绍Spark部署模式及任务运行模式、流程

12分48秒

课时124

SparkShuffleManager分类及各自区别?

33分10秒

课时125

SparkShuffle文件寻址流程

11分19秒

课时126

SparkShuffle调优参数有哪些

14分0秒

课时127

Spark内存管理及参数

5分29秒

课时128

Spark任务提交给Executor指定多少内存不会导致Shuffle OOM

23分5秒

课时129

RDD、DataFrame、Dataset区别?

7分43秒

课时130

Spark on Hive和Hive on Spark有什么区别?

1分38秒

课时131

解释SQL查询优化器RBO和CBO特点

8分31秒

课时132

谈谈对SparkSQL AQE理解?

13分11秒

课时133

Spark 自适应AQE参数

8分40秒

课时134

SparkSQL优化

13分48秒

课时135

Spark读取Kafka中数据如何保证数据消费一致性?

57分24秒

课时136

Spark、MapReduce、Flink区别

43分53秒

课时137

Spark优化

56分50秒

课时138

spark数据倾斜处理

24分51秒

课时139

Spark基于Yarn运行出现资源不足的可能原因

6分42秒

您没有该体系课权限,需要开通权限请点击联系老师。
联系老师
个问题,0回答
提问
暂无提问,赶紧去提问吧~