课程介绍
课程章节
章节1:DPO训练方法原理和实现 (0节)
章节2:PPO训练方法原理和实现 (0节)
章节3:基于TRL训练大预言模型 (0节)
章节4:ChatGLM3-6B模型微调实践 (0节)
您没有该体系课权限,需要开通权限请点击联系老师。
联系老师
个问题,0回答
提问
暂无提问,赶紧去提问吧~