一、大模型介绍
1.大模型核心结束介绍
1)Transformer
2)指令精调
3)CoT
4)RLHF
2.ChatGPT发展历程和简介
3.国内外主流大模型对比
1)GTP-3
2)BLOOM
3)Alpaca
4)Chinchilla
4.垂直化落地
1)缩放法则Scalling Laws
2)计算利用率最优
3)不同训练方式对比
二、ChatGLM原理
1.通用模型GLM算法
1)背景
2)架构
2.基座模型GLM-130B
3.对话机器人ChatGLM、ChatGLM-6B介绍
1)模型架构
2)支持配置
3)常见名词解释
4.ChatGLM2-6B介绍
1)优化点
2)训练方式
三、ChatGLM2-6B微调
1.环境搭建
2.准备模型和数据
3.模型参数、微调方式介绍
4.答疑
四、ChatGLM2-6B模型导出、部署、服务提供
1.环境准备
2.微调后的模型导出
3.微调后的模型部署
4.提供服务
5.答疑
课程周期:
18小时(45分钟/课时)