课程介绍
课程章节
章节1:学习本课程的收益 (3节)

课时01

为什么学透prometheus可以进大厂

13分55秒

课时02

运维和运维开发同学在prometheus上的学习重点

14分31秒

课时03

为什么本节课的老师最专业

8分49秒

章节2:学习目标 (1节)

课时04

达到大厂要求的学习目标

10分30秒

章节3:安装prometheus和上手使用 (7节)

课时05

prometheus二进制安装

5分15秒

课时06

ui功能讲解之graph页面

13分26秒

课时07

ui其他页面讲解

13分46秒

课时08

prometheus配置文件和6大模块讲解

11分1秒

课时09

static_configs采集配置源码解读

15分26秒

课时10

prometheus命令行参数讲解

10分34秒

课时11

热更新源码解读

14分12秒

章节4:prometheus 基本概念介绍 (6节)

课时12

prometheus基本概念-sample数据点

11分0秒

课时13

prometheus四种查询类型

10分28秒

课时14

四种标签匹配模式

10分54秒

课时15

四种数据类型

13分22秒

课时16

时间范围选择器

6分44秒

课时17

实用promql介绍

13分48秒

章节5:node_exporter安装和使用 (6节)

课时18

#编写ansibleplaybook批量安装二进制

12分53秒

课时19

黑白名单配置

11分22秒

课时20

sdk指标和配置本地采集目录

9分50秒

课时21

配置prometheus采集通过http请求参数过滤采集器

10分48秒

课时22

node_exporter采集原理简介

13分56秒

课时23

node_exporter二开新增自定义模块

13分29秒

章节6:grafana安装和使用 (6节)

课时24

grafana和mysql安装

5分4秒

课时25

基础功能介绍

13分45秒

课时26

panel中操作

13分11秒

课时27

设置表格tables

14分53秒

课时28

使用变量查询

16分34秒

课时29

使用dashboard商城搜索导入模板

9分31秒

章节7:黑盒探针blackbox_exporter安装和使用 (7节)

课时30

使用ansible部署 blackbox_exporter

5分36秒

课时31

页面访问http探测,模块和探针介绍

11分53秒

课时32

多实例采集的说明relabel配置

12分24秒

课时33

ssh探测和ping探测使用

12分21秒

课时34

grafana上导入模板看图并讲解告警

14分41秒

课时35

blackbox框架源码和http探测源码解读

19分5秒

课时36

prometheus relabel address替换源码解析

17分41秒

章节8:mysqld_exporter使用和源码改造 (3节)

课时37

使用ansible部署mysql_exporter,注入dsn环境变量

7分58秒

课时38

grafana上导入模板看图并讲解告警

19分37秒

课时39

修改mysqld_exporter源码 ,改造成类似blackbox的探针型,实现一对多探测

23分45秒

章节9:process-exporter安装和使用 (3节)

课时40

使用ansible部署 process-exporter

6分38秒

课时41

grafana 上导入模板看图并讲解告警

10分41秒

课时42

查看源码,讲解采集原理

11分26秒

章节10:redis-exporter安装和使用 (3节)

课时43

使用ansible部署 redis-exporter

3分18秒

课时44

grafana上导入模板看图并讲解告警

12分58秒

课时45

查看源码,讲解采集原理

7分50秒

章节11:java应用监控jvm实例 (2节)

课时46

监控kafka和zookeeper的jvm

15分50秒

课时47

导入grafana大盘和指标讲解

12分27秒

章节12:pushgateway使用 (2节)

课时48

pushgateway应用场景和部署

6分58秒

课时49

使用prometheus-sdk向pushgateway打点

19分3秒

章节13:告警和alertmanager简单使用 (6节)

课时50

alertmanager核心功能点介绍和安装部署

12分39秒

课时51

编写go程序充当告警触发端和接收端

13分17秒

课时52

alertmanager分组功能

20分27秒

课时53

告警抑制实例

8分24秒

课时54

告警静默

10分30秒

课时55

编写go代码接收webhook的告警发送钉钉

15分43秒

章节14:k8s监控难点分析 (2节)

课时56

为什么说k8s中监控更复杂了

10分40秒

课时57

k8s中我们都需要监控哪些组件

11分10秒

章节15:k8s监控环境搭建,yaml讲解 (10节)

课时58

在k8s部署grafana-deployment并导入k8s大盘

12分8秒

课时59

定义一个prometheus数据存储使用的pv

9分17秒

课时60

StorageClass和volumeClaimTemplates

10分26秒

课时61

prometheus使用的ClusterRole等RBAC对象

10分6秒

课时62

创建监控控制平面的service

2分17秒

课时63

创建prometheus使用的配置configmap

17分16秒

课时64

创建prometheus的statsfulset配置

21分53秒

课时65

在k8s部署prometheus statefulset

6分30秒

课时66

grafana-deployment-yaml讲解

10分53秒

课时67

使用kubeadm 10分钟部署k8集群

14分41秒

章节16:k8s容器基础资源指标 采集原理和指标讲解 (3节)

课时68

k8s容器基础资源指标采集原理讲解

13分40秒

课时69

k8s容器基础资源指标讲解

8分12秒

课时70

k8s容器cpu内存告警指标与资源request和limit

11分44秒

章节17:k8s对象资源指标 (2节)

课时71

ksm关注指标讲解 pod和node状态的统计

18分52秒

课时72

ksm源码讲解

22分47秒

章节18:k8s服务组件指标 (2节)

课时73

k8s服务组件之4大黄金指标讲解

11分5秒

课时74

k8s-apiserver监控源码解读

14分18秒

章节19:k8s部署在pod中业务埋点指标 (3节)

课时75

使用k8s的sdk编写一个项目获取pod和node信息

17分13秒

课时76

编写dockerfile和k8s yaml

10分11秒

课时77

打镜像部署到k8s中,prometheus配置采集并在grafana看图

18分35秒

章节20:分析pull模型在k8s中的应用,对比push模型 (1节)

课时78

分析pull模型在k8s中的应用,对比push模型

10分30秒

章节21:k8s接口鉴权、认证和在监控中的实现 (2节)

课时79

k8s接口鉴权token认证和prometheus的实现

20分47秒

课时80

k8s中etcd的tls双向认证原理解析

13分25秒

章节22:k8s服务发现原理解析 (3节)

课时81

k8s不同role级别的服务发现

11分57秒

课时82

k8s中ksm采集的使用的dns解析

11分3秒

课时83

解读k8s服务发现源码

9分45秒

章节23:章k8s监控中标签relabel的应用和k8s监控总结 (2节)

课时84

k8s监控中标签relabel的应用和原理

18分46秒

课时85

prometheus为k8s做的4大适配工作

5分30秒

章节24:主流服务发现类型介绍,监控系统和服务树CMDB如何打通 (6节)

课时86

prometheus-exporter管理

9分30秒

课时87

prometheus target管理

9分12秒

课时88

基于文件的服务发现模式

10分56秒

课时89

基于consul服务发现模式

16分27秒

课时90

基于http服务发现模式

9分51秒

课时91

监控系统在采集侧对接运维平台

15分14秒

章节25:如何降低采集资源消耗 (3节)

课时92

降低采集资源消耗的收益和无用监控指标的判定依据

17分42秒

课时93

采集端高基数的现象和原因

13分5秒

课时94

使用relabel中的drop将对应的无用指标丢弃

5分58秒

章节26:分位值作用和原理 (3节)

课时95

分位值summary和histogram对比

13分21秒

课时96

histogram线性插值法源码解读

15分48秒

课时97

summary源码解读

11分38秒

章节27:采集端高可用实战 (9节)

课时98

采集端单点问题原因和危害,静态分片方案的弊端

8分42秒

课时99

动态分片方案和它要解决的问题

7分11秒

课时100

一致性哈希算法介绍

17分33秒

课时101

一致性哈希算法的golang实现和迁移率测试

19分21秒

课时102

go实战项目prome-shard的代码准备工作

11分6秒

课时103

consul注册服务、抽象获取target的方法

22分40秒

课时104

开启一致性哈希环变更监听处理和consul-watch服务

13分5秒

课时105

把target做一致性哈希进行分发

12分44秒

课时106

调用go-ansible执行playbook拷贝json文件重载采集器

20分43秒

章节28:go实战项目 动态分片解决pushgateway高可用 (4节)

课时107

pushgateway单点问题和动态分片方案介绍

6分28秒

课时108

go实战项目dynamic-sharding的代码准备工作

9分55秒

课时109

一致性哈希和推送数据的redirect流程

14分3秒

课时110

编译运行测试效果

26分50秒

章节29:如何使用非侵入式形式如日志接入prometheus (7节)

课时111

时序监控和日志监控的对比,分析日志监控的核心诉求

10分49秒

课时112

golang实战项目log2metrics架构说明

11分24秒

课时113

准备工作,编写配置文件,解析配置,校验正则,设置log

13分40秒

课时114

日志任务增量更新管理器和具体的日志job对象

16分43秒

课时115

日志消费组和日志正则处理对象AnalysPoint

17分43秒

课时116

时序统计的结构体对象和metrics结果打点方法

14分51秒

课时117

编译运行,读取日志配置看图

17分3秒

章节30:时序数据库存储模型 (2节)

课时118

时序数据库TSDB的典型特点

15分2秒

课时119

不得不谈的lsm:分层结构和lsm数据结构

15分40秒

章节31:facebook-gorilla压缩算法原理 (3节)

课时120

时序数据压缩的必要和facebook-gorilla压缩算法简介

7分24秒

课时121

DOD压缩和相关的prometheus源码解读

13分11秒

课时122

XOR压缩和相关的prometheus源码解读

6分51秒

章节32:prometheus自研tsdb底层原理 (5节)

课时123

prometheus倒排索引源码解析

21分49秒

课时124

prometheus倒排索引统计功能

14分1秒

课时125

mmap的在io提速上的应用和prometheus的应用

13分51秒

课时126

prometheus存储磁盘数据结构和存储参数

11分7秒

课时127

compact目的和源码解读

12分29秒

章节33:集群tsdb原理和实战(一) (7节)

课时128

prometheus本地存储单点问题和remote解决方案

6分4秒

课时129

prometheus联邦功能源码解读和它的问题

10分31秒

课时130

prometheus 低成本存储multi_remote_read方案说明

23分37秒

课时131

为什么remote_read查询series比直接查询要慢很多和源码解读

12分51秒

课时132

remote实战项目之设计prometheus数据源的结构

10分2秒

课时133

read的代码,查询series方法和QueryEngine的RangeQuery方法

19分16秒

课时134

write的代码编写和测试

17分5秒

章节34:m3db原理和实战 (4节)

课时135

uber开源的m3db简介

12分29秒

课时136

m3db上手搭建

16分57秒

课时137

m3db-oom的内存火焰图和内存分配器加油模型源码解读

14分52秒

课时138

m3db调优踩坑问题总结

17分58秒

章节35:thanos项目和组件源码解读 (6节)

课时139

thanos项目介绍和二进制部署

27分46秒

课时140

thanos-sidecar源码阅读

20分39秒

课时141

thanos-store 源码阅读

15分40秒

课时142

thanos-query 源码阅读

21分53秒

课时143

thanos-compactor 源码阅读

11分57秒

课时144

thanos-rule 源码阅读

12分28秒

章节36:kube-prometheus和prometheus-operator原理和实战 (5节)

课时145

kube-prometheus项目讲解和安装部署

51分0秒

课时146

内置的k8s采集任务分析

32分24秒

课时147

grafana-dashboard看图分析

13分23秒

课时148

prometheus告警和预聚合分析

15分9秒

课时149

自定义指标接入prometheus-operator

20分30秒

章节37:prometheus核心接口源码解析 (3节)

课时150

prometheus管理接口源码讲解

12分16秒

课时151

prometheus分析接口源码讲解

10分50秒

课时152

prometheus5大数据查询接口

29分51秒

章节38:范围查询分阶段原理 (1节)

课时153

range_query和querylog源码解读

32分22秒

章节39:prometheus接口开发实战 (1节)

课时154

用最近1天的内存平均使用率等出业务资源利用率报表

13分39秒

章节40:高基数查询和prometheus预聚合原理和源码解读 (3节)

课时155

高基数查询原因总结和判定高基数的依据

14分11秒

课时156

预聚合和prometheus-record使用

15分12秒

课时157

prometheus预聚合源码解读

11分37秒

章节41:查询提速实战提升查询速度30-100倍 (6节)

课时158

预聚合提速实战项目之需求分析和架构设计

10分18秒

课时159

ansible拷贝日志文件,解析日志并判断重查询

11分48秒

课时160

将重查询记录增量更新到consul和redis中

9分7秒

课时161

修改confd源码增加静态分片功能

8分50秒

课时162

nginx拦截prometheus查询请求使用lua脚本做promql的检查替换

5分45秒

课时163

安装部署,效果测试,架构回顾

53分38秒

章节42:告警触发prometheus源码解读和 告警触发模块高可用方案 (2节)

课时164

从一条告警的触发分析prometheus alert告警源码

27分1秒

课时165

告警触发trigger模块单点问题和高可用解决方案

20分54秒

章节43:alertmanager源码解读和实战 (3节)

课时166

配置alertmanager高可用并测试

17分59秒

课时167

gossip协议解读

9分53秒

课时168

alertmanager流水线处理源码解读

16分58秒

章节44:告警回调实战 (1节)

课时169

告警自愈之回调重启服务实战

14分44秒

您没有该体系课权限,需要开通权限请点击联系老师。
联系老师
个问题,0回答
提问
暂无提问,赶紧去提问吧~