课程大纲:
大数据分析培训
第一阶段:大数据前沿知识及hadoop入门
1.大数据前沿知识介绍
2.课程介绍
3. Linux及unbuntu系统基础
4.hadoop的单机和伪分布模式的安装配置
第二阶段:Hadoop部署进阶
1.Hadoop集群模式搭建
2. Hadoop分布式文件系统HDFS深入剖析
3.使用hdfs提供的api进行hdfs文件操作
4. Mapreduce概念及思想
第三阶段:大数据导入与存储
1.mysql数据库基础知识
2.hive安装部署与案例
3.sqoop安装及使用
第四阶段:Hbase理论及实战
1. hbase简介
2.安装及配置
第五阶段:Spark配置及使用场景
1. spark简介、安装及配置
2.scala简介、安装及语法讲解
第六阶段:spark大数据分析原理
1.Spark内核:基本定义、Spark任务调度
2.Spark Streaming 实时流计算
3.Spark MLlib 机器学习
4.Spark SQL 实战
第七阶段:hadoop+Spark大数据分析
1.实战案例深入解析
2.hadoop+Spark的大数据分析之分类
3.Logistic回归与主题推荐