大数据中的R语言编程培训
第1讲:R语言介绍
1.1 R语言介绍。什么是R语言?如何下载安装R语言环境?以及简单的R语言编程实例。
第2讲:创建数据集 - 数据集的概念
2.1 数据集的概念。数据集的构成,如何在R语言环境中创建、使用数据集。
第3讲: 数据结构中的向量与矩阵
2.2 向量与矩阵的定义,以及如何在R语言环境中使用这两种数据结构。
第4讲:数据结构中的数组和数据框、因子与列表,数据的输入与数据集的标注
2.3.1 数组和数据框。数组是可以在两个以上的维度存储数据的R数据对象;数据框是可以将不同的数据类型组合在一起的数据结构。
2.3.2 其他数据结构,因子和列表。因子是R中用于对数据进行分类,并将其存储为级别的数据对象;列表是可以包含多个不同数据元素的数据对象。
2.4 数据的输入和数据集标注。数据输入包括从键盘输入、从多源数据导入等,数据集标注包括添加变量标签、值标签等。
第5讲:图形初阶
3.1 创建和保存图形,图形参数。了解R中作图的函数,及其使用方法。
3.2 图形的修改及组合。添加文本、自定义坐标轴、添加刻度线、图例和标注等;并学习如何使用par函数和layout函数进行图形的组合。
第6讲:数据的管理
4.1 基础数据管理。介绍数据是什么?如何对数据进行管理。
4.2 变量、缺失值和日期值。对数据的类型进行讨论,在数据处理之前要先对数据进行清洗、整理。得到规范的数据以方便后续的分析工作。
4.3 数据的排序、合并。介绍基本的排序方法以及数据的合并方法,子集以及使用SQL语句操作数据框等。
第11讲:统计分析
7.1 基本统计分析
7.2 相关性
第7讲:高级数据管理 -- 数学函数、统计函数和字符处理函数
5.1 数学函数与统计函数
5.2 字符处理函数
第8讲:一个数据处理实例
5.3 一个数据处理实例。将学生的各科期末考试成绩组合为单一的成绩衡量指标,并基于相对名次(前20%,后20%等)给出A到F的评分,按照学生的姓氏和名字的首字母排序后输出。
5.4 控制流语句
5.5 自定义函数
第9讲:数据的可视化 -- 条形图和饼状图
6.1 条形图和饼状图
第10讲:数据的可视化 -- 基本图形中的直方图、核密度图、箱型图和点图
6.2 直方图、核密度图、箱型图和点图
第12讲:回归分析
8.1 简单线性回归、多项式回归以及多元线性回归的理解与实战
第13讲:实战案例分析
9.1 实战案例分析(一)
9.2 实战案例分析(二)