大数据分析挖掘-基于Hadoop/Mahout/MLlib的大数据培训

课程目录：大数据分析挖掘-基于Hadoop/Mahout/MLlib的大数据培训

4401 人关注

（78637/99817）

课程大纲

课程大纲：

    大数据分析挖掘-基于Hadoop/Mahout/MLlib的大数据培训

第一讲大数据挖掘及其背景

1)数据挖掘定义

2)Hadoop相关技术

3)大数据挖掘知识点

第二讲 MapReduce/DAG计算模式

1）分布式文件系统DFS

2）MapReduce计算模型介绍

3）使用MR进行算法设计

4）DAG及其算法设计

第三讲云挖掘工具Mahout/MLib

1）Hadoop中的Mahoutb介绍

2）Spark中的Mahout/MLib介绍

3）系统及其Mahout实现方法

4）信息聚类及其MLlib实现方法

5）分类技术在Mahout/MLib中的实现方法

第四讲系统及其应用开发

1）一个系统的模型

2）基于内容的

3）协同过滤

4）基于Mahout的电影案例

第五讲分类技术及其应用

1）分类的定义

2）分类主要算法

3）Mahout分类过程

4）评估指标以及评测

5）贝叶斯算法新闻分类实例

第六讲聚类技术及其应用

1）聚类的定义

2）聚类的主要算法

3）K-Means、Canopy及其应用示例

4）Fuzzy K-Means、Dirichlet及其应用示例

5）基于MLlib的新闻聚类实例

第七讲关联规则和相似项发现

1）购物篮模型

2）Apriori算法

3）抄袭文档发现

4）近邻搜索的应用

第八讲流数据挖掘相关技术

1）流数据挖掘及分析

2）Storm和流数据处理模型

3）流处理中的数据抽样

4）流过滤和Bloom filter

第九讲云环境下大数据挖掘应用

1）与Hadoop/Yarn集群应用的协作

2）与Docker等其它云工具配合

3）大数据挖掘行业应用展望

六、培训

1, 了解大数据处理技术的相关知识。

2，学习Hadoop/Yarn/Spark的核心数据分析技术

3，深入学习Mahout/MLlib挖掘工具在大数据中的使用。

4，掌握Storm流处理技术和Docker等技术与大数据挖掘结合的方法。

课程教师

曙海专家讲师

曙海的讲师队伍名校博士、硕士学历的工程师占绝大多数，他们大部分为上海贝尔，TI德州仪器，华为，中科院，中兴，Xilinx,Intel英特尔,NI公司，Cadence公司,Synopsys，IBM，Altera，Oracle，synopsys，微软，飞思卡尔等大型公司高级工程师，项目经理，技术支持专家，他们有着深厚的专业技能和技术素养，丰富的项目实战经验，基本上都有十多年实际项目经验，开发过多个大型项目。

针对客户实际需求，案例教学，边讲边练，互动式授课，曙海的专家讲师以专业、敬业的精神，倾囊相授，不辜负每个学员的托付和期望。

进阶课程

实用Linux Shell编程 Vim编辑器 Linux命令实例练习

Copyright @2002-2024 曙海教育集团 | 沪ICP备08026168号