课程目录:R语言数据挖掘与商业分析建模培训
4401 人关注
(78637/99817)
课程大纲:

R语言数据挖掘与商业分析建模培训

 

 

R语言数据挖掘与商业分析建模
第0讲 数据分析基本概念
0.1 商业数据分析的本质

0.2 商业数据分析中心建设

0.3 商业数据分析的阶段与行业运用

0.4 商业数据分析在银行中的运用

0.5 商业数据挖掘通用方法论

0.6 课程安排

第1讲 准备知识
1.1.0 引言与课程介绍

1.1.1 Capital One的故事

1.1.2 风险管理的理解

1.1.3 巴塞尔协议介绍

1.1.4 三大类风险

1.1.5 信用评分卡类型

1.1.6 信用风险IT系统

1.2.1 数据挖掘方法分类

1.2.2 分类模型示例

1.3.1 R的身世和特点1

1.3.2 安装R和包

1.4 数据分析流程演示

1.5 参考资料讲解

第2讲 R语言编程基础与数据整合(分开2)
2.1.1 R的基本数据类型

2.1.2 R的数据结构

2.1.3 R程序控制

2.1.4_1 R的函数与包

2.1.4_2 R的函数与包

2.1.5 R的时间与日期类型

2.1.6 在R中读取数据

2.2.1 背景介绍

2.2.2 数据库基础知识

2.2.3 数据介绍

2.3.1 SQL语句介绍

2.3.2 纵向连接表

2.3.3 横向连接表

第3讲 描述性统计分析基础
3.1 描述性统计与探索型数据分析-1

3.1 描述性统计与探索型数据分析-2

3.2 APPLY函数族

3.3 制图原理-1

3.3 制图原理-2

3.4 R基础绘图包

3.5 GGPLOT2绘图

3.6 使用SQL进行汇总

3.7_1 使用描述性方法做贷款违约特征探索_1

3.7_2 使用描述性方法做贷款违约特征探索_2

3.7_3 使用描述性方法做贷款违约特征探索_3

第4讲 数据清洗与信息压缩(分开2)
4.1 FRM提取行为变量

4.2 数据重组

4.3 抽样知识

4.4.0 信息压缩(概述)

4.4.1 分类变量重编码(概化)

4.4.2 基于目标变量的转换-WOE

4.5.1 主成分分析

4.5.2_1 变量聚类

4.5.2_2 变量聚类

4.6 脏数据或数据不正确

4.7 数据重复

4.8 缺失值处理

4.9 噪声值处理

第5讲 统计推断基础
5.1 参数估计

5.2 假设检验与单样本T检验

5.3 两样本T检验

5.4 方差分析

5.5 相关分析

5.6 卡方检验

第6讲 客户价值预测_线性回归模型与诊断
6.0 内容介绍

6.1 相关性分析

6.2.1 简单线性回归_1

6.2.1 简单线性回归_2

6.2.1 简单线性回归_3

6.2.2 模型解释

6.2.3 多元线性回归

6.2.4 多元线性回归的变量筛选

6.3.0 线性回归的诊断介绍

6.3.1 残差分析

6.3.2 强影响点分析

6.3.3 多重共线性分析

6.4 数值预测评估原理

6.5.0 正则化方法介绍

6.5.1 岭回归

6.5.2 LASSO算法

6.6 附录:估计方法

第7讲 用逻辑回归作申请评分信用评级
7.0 内容介绍

7.1 分类变量的相关关系

7.2 逻辑回归

7.3 模型评估_1决策类

7.3 模型评估_2排序类介绍

7.3 模型评估_3ROC

7.3 模型评估_4其它排序类

7.3 模型评估_5R的实现

7.4 因果关系建模与取数逻辑

7.5 附录:逻辑回归估计方法

第8讲 用决策树做可表述的模式
8.1 决策树建模思路

8.2 决策树建模基本原理

8.3 Quinlan系列决策树建模原理_1

8.3 Quinlan系列决策树建模原理_2

8.4 CART决策树建模原理_1

8.4 CART决策树建模原理_2

8.5 模型修剪—以CART为例

8.7 组合算法与随机森林

8.8 汽车贷款违约的模式表述

第9讲 用神经网络做行为信用评级
9.0 前言

9.1 基本概念

9.2 人工神经网络结构

9.3 感知器与BP网络_1

9.3 感知器与BP网络_2

9.3 感知器与BP网络_3

9.3 感知器与BP网络_4

9.4 径向基神经网络_1

9.4 径向基神经网络_2

9.4 径向基神经网络_3

第10讲 分类器入门与支持向量机
10.1.0 分类器的概念

10.1.1 KNN算法_1

10.1.1 KNN算法_2

10.1.2 朴素贝叶斯_1

10.2.1 支持向量机概述

10.2.2 支持向量机详述_1

10.2.2 支持向量机详述_2

10.2.2 支持向量机详述_3

第11讲 客户聚类与聚类后画像
11.1 基本概念

11.2 层次聚类_1

11.2 层次聚类_2

11.3.1 K-means聚类_1

11.3.1 K-means聚类_2

11.3.1 K-means聚类_3

11.3.2使用决策树做聚类后客户画像

第12讲 使用推荐算法提升客户价值
12.1 广告推荐介绍

12.2 购物篮分析与运用_1

12.2 购物篮分析与运用_2

12.3 相关性在推荐中的运用

12.4.1 协同过滤介绍

12.4.2 基于物品的协同过滤

12.5 基于内容的推荐

12.6 附录:矩阵奇异值分解(SVD)在协同过滤中的运用

第13讲 使用时间序列(ARIMA)分析做销售量预测
13.1 认识时间序列

13.2 简单时间序列分析法:平滑算法_1

13.2 简单时间序列分析法:平滑算法_2

13.2 简单时间序列分析法:平滑算法_3

13.2 简单时间序列分析法:平滑算法_4

13.3 平稳时间序列(ARMA)模型设定与识别_1

13.3 平稳时间序列(ARMA)模型设定与识别_2

13.3 平稳时间序列(ARMA)模型设定与识别_3

13.4 非平稳时间序列(ARIMA)模型_1

13.4 非平稳时间序列(ARIMA)模型_2

13.5 实际数据时间序列建模步骤_1

13.5 实际数据时间序列建模步骤_2

13.5 实际数据时间序列建模步骤_3

第14讲 汽车金融申请信用评级模型案例
案例1.1 业务理解

案例1.2 数据理解

案例1.3.1 拒绝推断_1

案例1.3.1 拒绝推断_2

案例1.3.1 拒绝推断_3

案例1.3.2 变量粗筛

案例1.3.3 变量细筛与数据清洗_1

案例1.3.3 变量细筛与数据清洗_2

案例1.3.3 变量细筛与数据清洗_3

案例1.3.4 连续变量分箱WOE转换

案例1.4 建模与模型评估

案例1.5 模型监测