南京
杭州
上海
025-87787966    0571-88257871

Python数据挖掘

发布日期: 2024/4/23 15:16:37

课程大纲
一、机器学习与特征工程快速入门
  1.大数据、云计算、物联网与人工智能介绍
  2.机器学习分类与应用场景
  3.Numpy、Pandas快速回顾
  4.数据加载、分析、特征工程实现
  5.数据预处理8大策略介绍
二、数据挖掘案例:电影推荐系统实战
  1.智能推荐系统应用场景介绍
  2.算法基础:余弦相似度、皮尔逊系数、协同过滤算法
  3.数据读取、清洗与聚合操作
  4.推荐系统搭建与结果呈现
  5.恶意差评、刷单评论、无效评论的处理方案
三、数据清洗与预处理操作
  1.客户数据加载与清洗
  2.连续数据离散化
  3.数据相关性与降维操作
  4.数据的标准化与归一化操作
四、广告投放渠道聚类分析
  1.聚类算法原理介绍
  2.K均值极简案例
  3.数据加载、探索与特征工程
  4.KMeans实现客户样本分群
五、采用雷达图对数据进行画像
  1.直角坐标与极坐标概念回顾
  2.采用雷达图绘制用户特征画像
六、数据加载、探索、清洗实现
  1.机器学习三大类算法介绍:聚类、预测、分类
  2.线性回归模型介绍与公式推导
  3.数据加载、预处理、特征工程
  4.训练集、验证集、测试集拆分
七、模型构建、训练与优化
  1.采用线性回归模型预测销售数据
  2.欠拟合、过拟合、模型优化
  3.采用L2正则化岭回归优化模型
八、可视化、模型封装、保存与二次加载
  1.采用matplotlib可视化训练过程
  2.Pipeline构建机器学习工作流
  3.模型参数保存与二次加载
九、数据加载、探索、清洗实现
  1.业务需求与数据加载、探索
  2.特征工程之:非数值转化为哑变量
  3.样本不均衡:上下采样实现
十、模型构建、训练、优化
  1.决策树模型创建与建树依据
  2.采用graphviz分析模型创建过程
  3.模型超参数、交叉验证与网格搜索
  4.模型可视化呈现、构建要点理解
十一、模型保存、加载、评价函数
  1.正确率、精确率与召回率
  2.分类模型评估方法:ROC与KS曲线
  3.模型保存与二次调用
十二、KNN 算法实现就近酒店推荐
  1.KNN原理介绍与数据处理
  2.采用KNN算法实现就近酒店推荐
十三、朴素贝叶斯算法实现电商评价分类
  1.Jieba、TF-IDF算法介绍
  2.贝叶斯实现文本评价分类
十四、决策树、随机森林构建反欺诈风控模型
  1.加载银行风控数据
  2.PCA主成份分析、特征工程
  3.模型创建与训练
  4.网格搜索优化超参数
  5.AdaBoost与GBDT模型介绍
  6.采用集成学习重构反欺诈风控模型
十五、TensorFlow 快速入门
  1.传统机器学习算法局限性介绍
  2.神经网络极简史、优势介绍
  3.环境搭建、第一个案例
  4.张量、变量、操作
  5.TensorBoard可视化神经网络
十六、手动构建DNN深度神经网络
  1.人脸FDDB数据集介绍与获取
  2.简单神经网络原理分析
  3.梯度下降:正向传播与反向传播
  4.神经网络可调超参数介绍
  5.激活函数:Sigmoid到ReLu
  6.损失函数与评估指标的选择
十七、CNN卷积神经网络快速入门
  1.CNN与DNN优缺点对比
  2.滑动窗口特征抽取介绍
  3.卷积过程中填充与步长计算
  4.池化层与特征过滤
十八、CNN网络性能优化
  1.优化器与学习率
  2.Droput与数据增强实现
  3.VGGNet、GoogLeNet、ResNet网络介绍
十九、Keras重构CNN神经网络
  1.卷积层与池化层原理介绍
  2.Keras体系架构介绍
  3.采用Keras重构神经网络层
二十、构建RNN循环神经网络
  1.时序数据与文本加载
  2.词向量与词嵌入
  3.RNN神经网络构建与原理分析
  4.RNN实现影评情感分类
二十一、自然语言处理之命名实体识别
  1.HMM与CRF 算法介绍
  2.RNN重构为BiLSTM
  3.基于BiLSTM命名实体识别实战
  4.迁移学习与Bert命名实体识别
二十二、阿里云机器学习PAI使用
  1.申请、免费开通、控制台介绍与使用
  2.拖拽方式实现机器模型搭建
  3.基于阿里云PAI的推荐系统模型训练与使用
二十三、ChatGPT快速应用与案例实践
  1.NLP、ChatGPT3、ChatGPT4发展史与特性介绍
  2.注意力与自注意力机制介绍
  3.模型的计算、推理、常识与恶意误导测试
  4.Prompt工程和技巧
  5.ChatGPT4 Plus的获取与使用
  6.激活GPT思维链
  7.GPT4 Plus新特性:Custom Instructions 与角色设置
  8.Excel中使用GPT插件提升表格处理效率
  9.GPT与AIPPT结合一键生成商务PPT
二十四、ChatGPT第三方联动与模型微调Code Interpreter:实现自动数据挖掘并生成分析报告
  1.GPT4 Action:如何调用其它应用(查询物流、发短信、发邮件…….)
  2.语聚AI赋能GPT4 实现办公流程自动化
  3.Token与计费介绍
  4.基于GPT4的模型微调实现
  5.API Key的申请与Python调用
  6.文字、语音、与Dall-E图像生成实现
  7.ChatGPT4 连接微信构建智能客服
二十五、LangChain 构建企业知识系统
  1.LangChain的系统安装和快速入门
  2.体验 LangChain + LLM 的全新开发范式
  3.LangChain结构体系介绍与Toolkits一览
  4.模型I/O:输入提示、模型调用、解析与输出
  5.提示工程,思维链与思维树
  6.模型调用:LangChain整合GPT4/ChatGLM
  7.OutPutParse实现列表输出与推荐
  8.Memory动态存储历史记忆
  9.使用链和代理实现信息查询
  10.如何引用异步通信机制
  11.Tracing与Debug的使用
  12.根据环境构建知识推送与存储策略
  13.构建用户的人脉管理系统
  14.聊天客服的机器人开发与测试
  15.LangChain表达式语言LCEL初探
  16.LangSmith 与 Hub

课程周期:
60课时(45分钟/课时)

相关培训课程

TRAINING COURSE
无标题文档