课程目录:大数据技术原理与应用项目实战培训
4401 人关注
(78637/99817)
课程大纲:

大数据技术原理与应用项目实战培训

 

 

 

1 Spark MLLib
1.1 基于大数据的机器学习
1.2 机器学习库MLLib概述
1.3 基本数据类型
1.4 机器学习流水线
1.5 特征提取、转换和选择
1.6 分类算法
1.7 聚类算法
1.8 协同过滤算法
1.9 模型选择和超参数调整
1.10 将结果导入到Mysql
2 于Hadoop技术的用户行为分析案例
2.1 数据预处理
2.2 上传数据至Hive
2.3 数据分析
2.4 导出分析结果至Mysql
3 基于Spark技术的交易数据分析与回头客预测案例
3.1 对文本文件形式的原始数据集进行预处理
3.2 把文本文件的数据集导入到数据仓库HDFS中
3.3 支持向量机SVM分类器预测回头客分析