课程大纲
一、数据挖掘概述与数据预处理
1、目标:对数据挖掘建立清晰、正确的认识;了解如何对数据进行初步的统计分析,掌握利用报表、统计指标、可视化图形对数据进行概括性描述;掌握数据预处理的基本技巧,例如数据清洗、规范化转换、连续值离散化、缺失值的处理;了解数据仓库的基本概念和建设。
—— 了解数据挖掘基本概念、模型和能解决的问题;
—— 数据挖掘面临的问题
—— 统计分析的基本方法和度量
—— 数据准备与数据仓库
—— 数据预处理的方式方法
二、挖掘方法1:
1、目标:掌握频繁项集、闭合频繁项集、关联规则概念,典型关联规则挖掘算法,关联规则挖掘的建模与分析;掌握决策树分类法,理解预测准确率与过拟合的关系,能够构建训练集、测试集,并用学习到的分类模型进行分类预测。
—— 关联分析算法与模型设计
—— 决策树算法与模型设计
—— 结合工具软件操作
三、挖掘方法2:
1、目标:理解贝叶斯方法,能够用工具建立贝叶斯网络模型;掌握聚类典型算法k-均值聚、层次聚类 和基于密度的聚类,能够构建聚类模型,对数据进行有效聚类。
—— 贝叶斯与贝叶斯网络算法与模型设计
—— 典型聚类算法与模型设计
—— 结合工具软件操作
四、其他挖掘方法与挖掘前沿技术
1、目标:了解多种挖掘算法与技术,了解数据挖掘的前沿技术,以利于日后可能的应用。
—— 时序和序列数据的挖掘
—— 神经网络分类
—— 图挖掘、社会网络挖掘分析与介绍
—— 其他挖掘技术
五、挖掘模型建模和实例分析
1、目标:了解多个工具软件,对个工具软件有总体认识,以便恰当选择商业化的挖掘工具;通过一个实例,应用挖掘工具逐步、详细实现挖掘工程。
—— 其他多种挖掘工具的介绍。
—— 结合一个实例,例如市场营销、证券、电信业务、银行业务等,进行实际建模
与挖掘分析。
1、目标:对数据挖掘建立清晰、正确的认识;了解如何对数据进行初步的统计分析,掌握利用报表、统计指标、可视化图形对数据进行概括性描述;掌握数据预处理的基本技巧,例如数据清洗、规范化转换、连续值离散化、缺失值的处理;了解数据仓库的基本概念和建设。
—— 了解数据挖掘基本概念、模型和能解决的问题;
—— 数据挖掘面临的问题
—— 统计分析的基本方法和度量
—— 数据准备与数据仓库
—— 数据预处理的方式方法
二、挖掘方法1:
1、目标:掌握频繁项集、闭合频繁项集、关联规则概念,典型关联规则挖掘算法,关联规则挖掘的建模与分析;掌握决策树分类法,理解预测准确率与过拟合的关系,能够构建训练集、测试集,并用学习到的分类模型进行分类预测。
—— 关联分析算法与模型设计
—— 决策树算法与模型设计
—— 结合工具软件操作
三、挖掘方法2:
1、目标:理解贝叶斯方法,能够用工具建立贝叶斯网络模型;掌握聚类典型算法k-均值聚、层次聚类 和基于密度的聚类,能够构建聚类模型,对数据进行有效聚类。
—— 贝叶斯与贝叶斯网络算法与模型设计
—— 典型聚类算法与模型设计
—— 结合工具软件操作
四、其他挖掘方法与挖掘前沿技术
1、目标:了解多种挖掘算法与技术,了解数据挖掘的前沿技术,以利于日后可能的应用。
—— 时序和序列数据的挖掘
—— 神经网络分类
—— 图挖掘、社会网络挖掘分析与介绍
—— 其他挖掘技术
五、挖掘模型建模和实例分析
1、目标:了解多个工具软件,对个工具软件有总体认识,以便恰当选择商业化的挖掘工具;通过一个实例,应用挖掘工具逐步、详细实现挖掘工程。
—— 其他多种挖掘工具的介绍。
—— 结合一个实例,例如市场营销、证券、电信业务、银行业务等,进行实际建模
与挖掘分析。