课程介绍
课程章节
章节1: 模型训练时显存占用问题 (2节)

课时01

模型训练 GPU 空间占用的计算

更新时间:2024-09-18

16分17秒

课时02

如何降低模型本身对 GPU 空间的占用

更新时间:2024-09-18

13分45秒

章节2: 从 ModelScope 魔搭社区获取模型 (1节)

课时03

代码实战通过 modelscope 下载模型文件

更新时间:2024-09-18

17分20秒

章节3: 半精度 half precision 模型训练 (2节)

课时04

半精度 float16 和其优势

更新时间:2024-09-18

12分19秒

课时05

上溢出和下溢出、启用半精度的方法

更新时间:2024-09-18

12分42秒

章节4: LLaMA 3.1 模型训练实战 (11节)

课时06

LLaMA3.1 介绍与不同版本区别

更新时间:2024-09-21

11分23秒

课时07

LLaMA3.1 整体概览与模型架构升级

更新时间:2024-09-21

13分40秒

课时08

代码实战之导包和数据预处理

更新时间:2024-09-21

16分36秒

课时09

Llama3.1-8B 模型加载

更新时间:2024-09-21

11分1秒

课时10

半精度模型本地训练

更新时间:2024-09-21

12分31秒

课时11

租用云端服务器和 vscode 远程登陆

更新时间:2024-09-23

16分38秒

课时12

云端服务器下载 Llama3.1 模型

更新时间:2024-09-23

12分45秒

课时13

学会云端服务器之克隆实例的妙用

更新时间:2024-09-23

10分49秒

课时14

云端服务器运行 Llama3.1 半精度训练

更新时间:2024-09-23

14分3秒

课时15

模型训练优化技巧之开启梯度检查点

更新时间:2024-09-23

13分26秒

课时16

Llama3.1 模型训练细节总结

更新时间:2024-09-26

11分7秒

章节5: ChatGLM 4 模型训练实战 (12节)

课时17

因果模型 CausalLM 与前缀模型 PrefixLM 的区别

更新时间:2024-09-26

12分7秒

课时18

GLM4 架构涉及的技术点与 GLM family

更新时间:2024-09-26

8分18秒

课时19

作为 PrefixLM 的 GLM 模型是怎样预训练的

更新时间:2024-09-26

14分4秒

课时20

GLM4 模型训练时该如何组织数据

更新时间:2024-09-26

12分6秒

课时21

云服务器 GLM4 模型下载和升级 transformers 模块

更新时间:2024-10-01

8分52秒

课时22

云服务器跨实例拷贝大模型 GLM4

更新时间:2024-10-01

9分51秒

课时23

测试加载 GLM4 分词器与模型

更新时间:2024-10-01

9分56秒

课时24

构建测试数据并且使用GLM4进行推理

更新时间:2024-10-01

12分23秒

课时25

组织 GLM4 训练数据

更新时间:2024-10-03

24分47秒

课时26

构建 GLM4 半精度模型以及 Lora 模型

更新时间:2024-10-03

12分20秒

课时27

GLM4 模型半精度训练及数值下溢问题的解决

更新时间:2024-10-03

11分25秒

课时28

批次变大后模型训练内存溢出的解决和训练后模型推理

更新时间:2024-10-03

9分15秒

章节6: 8 bit 量化与模型训练 (3节)

课时29

量化与最大绝对值量化

更新时间:2024-10-21

10分16秒

课时30

零点量化与离群值对量化的影响

更新时间:2024-10-21

12分26秒

课时31

混合精度分解量化

更新时间:2024-10-21

12分26秒

章节7: 4 bit 模型训练与 QLoRA 模型训练 (0节)
您没有该体系课权限,需要开通权限请点击联系老师。
联系老师
个问题,0回答
提问
暂无提问,赶紧去提问吧~