R数据挖掘技术-基于R语言的数据挖掘和统计分析技术培训
第一讲数据挖掘和R简介
1.1 数据挖掘
1.2 R语言
1.3 Iris数据集
1.4Bodyfat数据集
第二讲数据的导入与导出
2.1 R数据的保存与加载
2.2 CSV文件的导入与导出
2.3 通过0DBC从数据库中读取数据
2.4 从Excel中导入与导出数据
第三讲数据可视化展现
3.1 查看数据
3.2 单个变量展现
3.3 多个变量展现
3.4 更多探索
3.5 将图表保存到文件中
第四讲决策树与随机森林
4.1 使用party包构建决策树
4.2 使用rpart包构建决策树
4.3 随机森林
第五讲回归分析
5.1 线性回归
5.2 逻辑回归
5.3 广义线性回归
5.4 非线性回归
第六讲聚类分析
6.1 k-means聚类
6.2 k-medoids聚类
6.3 层次聚类
6.4 基于密度的聚类
第七讲离群点检测
7.1 单变量的离群点检测
7.2 局部离群点因子检测
7.3 用聚类方法进行离群点检测
7.4 时间序列数据的离群点检测
第八讲时间序列分析
8.1 R中的时间序列数据
8.2 时间序列分解
8.3 时间序列预测
8.4 时间序列聚类
8.5 时间序列分类
第九讲关联规则
9.1 关联规则的基本概念
9.2 Titanic数据集
9.3 关联规则挖掘
9.4 冗余
9.5 解释规则
9.6 关联规则的可视化
第十讲社交网络分析
10.1 词项网络
10.2 推文网络
10.3 双模式网络
第十一讲 R与Hadoop/Spark等大数据技术的融合
1)R/Hadoop数据处理技术介绍
2)SparkR数据处理技术介绍
3)基于Hadoop/Yarn集群的应用展望
六、培训
1,了解R语言数据挖掘的相关知识。
2,学习R的数据挖掘核心技术方法以及应用特征。
3,深入使用R在数据挖掘和分析中的使用。
4,了解R与Hadoop、Spark等技术的融合使用。