400-888-5228

课程长度:

48课时

 

培训目的:

第一部分  数据挖掘和 SPSS Modeler

课程将介绍数据挖掘原理、SPSS Modeler数据挖掘软件的基本操作和环境;学习如何使用SPSS Modeler读取,处理数据

目的

培训人员能够掌握数据挖掘理论和常用的建模技术、掌握机器学习的常见技术,比如神经网络、决策树等,并将其应用到具体业务操作中

 

第二部分  SAS数据分析和数据挖掘

课程基于SAS工具进行数据分析和挖掘

目标:

将各种类型的数据读入SAS数据集中

对SAS数据集进行校验和清洗

创建SAS变量和数据子集

合并SAS数据集

创建增强列表和总结报表

 

第三部分  R语言实战

R语言作为一种数据分析专业语言,是当今数据科学领域最流行的开源编程语言之一,在数据分析与机器学习领域已经成为一款最重要的工具。精通R语言的数据分析师是企业竞相争抢的高薪人才。

R语言实战课程采用MBA式的案例教学,结合统计理论,建模方法论、R语言编程和老师的丰富实际项目经验,力求让每一个学生都能够把学到的知识运用到实际工作中去。我们精选的案例是目前企业真实场景下应用很广泛的场景,集合了互联网用户分析、精准营销、风险评估、BI设计与实施等领域的数据挖掘实例,对您从事真正的数据分析工作有针对性的指导与帮助。

 

目标:

  1. 深度学习R语言和数据挖掘的前沿算法
  2. 理解企业真实业务场景的建模流程
  3. 熟练使用R语言进行建模和实操
  4. 成为有多种技能并能融会贯通的复合型数据分析人才

培训大纲:

第一部分  数据挖掘和 SPSS Modeler

  • 数据挖掘简介
  • CRISP-DM方法论
  • SPSS Modeler简介
  • SPSS Modeler的C/S架构和界面介绍
  • SPSS Modeler可视化程序的使用基础
  • 读取数据文件
  • SPSS Modeler可以读取的数据格式
  • 读取文本数据与查看数据、SPSS数据、数据库数据(SDAP)
  • SPSS Modeler中的字段类型、字段方向
  • 保存SPSS Modeler流
  • 数据理解---数据质量评估
  • 数据理解
  • 缺失值定义
  • 数据审核节点介绍
  • 分布图节点----初步理解字符型字段的分
  • 直方图/统计节点----初步理解数值型字段的分布
  • 简单数据整理
  • Clem语言简介
  • 选择节点,过滤节点和导出节点介绍
  • 自动生成操作节点
  • 寻找数据中的关系
  • 矩阵节点、网络图节点、统计节点、散点图节点、直方图节点
  • SPSS Modeler中的数据建模技术
  • 神经网络、规则归纳模型、模型比较
  • 聚类分析、关联规则、序列检测

 

第二部分  SAS数据分析和数据挖掘

  • Base SAS基础
  • SAS 系统简介
  • 启动SAS 软件
  • SAS 窗口环境
  • SAS 文件和逻辑库
  • 一个简单的SAS 程序
  • 读取外部数据到SAS数据集
  • SAS 编程基本概念
  • 通过DATA 步读取数据
  • 通过IMPORT 过程读取外部文件数据
  • 访问关系型数据库系统中的数据
  • SAS 程序错误及处理
  • 对单个数据集的处理
  • 选取部分变量
  • 操作数据集的观测
  • 创建新变量
  • 循环和数组
  • SAS常用函数
  • 将数据集写出到外部文件
  • 对多个数据集的处理
  • 数据集的纵向串接
  • 数据集的横向合并
  • 数据集的更新
  • 数据汇总和展示
  • 通过PRINT过程制作报表
  • 通过TABULATE过程制作汇总报表
  • 通过GPLOT过程制作图形
  • 通过GCHART过程制作图形
  • ODS输出传送系统
  • 案例解析:PRINT过程操作实例
  • 案例解析:汇总报表实例
  • 案例解析:GPLOT过程制作图形编程操作
  • 案例解析:GCHART过程绘制图形编程操作
  • 描述性统计分析
  • 基本概念
  • 描述性统计量
  • MEANS过程的补充
  • 案例解析:利用MEANS过程求各种统计量
  • 案例解析:利用UNIVARIATE过程求各种统计量
  • 案例解析: 频数表的生成实例
  • 参数估计与假设检验
  • 参数估计
  • 假设检验
  • 非参数假设检验
  • 分别拟合假设检验
  • 案例解析:TTEST过程的实例数据分析
  • 案例解析:总体均值检验
  • 案例解析:实验数据的配对T检验
  • 案例解析:数据比例的显著性检验
  • 案例解析:样本数据的正态性检验实例
  • 回归分析
  • 变量关系探索
  • 线性回归
  • 自变量间的共线性诊断
  • 案例解析:某大型服装连锁机构门店收入相关数据分析
  • 案例解析:分析可支配收入和消费性支出之间的关系
  • 案例解析:利用线性回归分析学生肺活量及有关变量的关系
  • 方差分析
  • 方差分析的基本原理
  • 单因素试验的方差分析
  • 显著因素下的水平间差异检验
  • 双因素试验的方差分析
  • 案例解析:分析四种止痛药效果之间是否有明显差异
  • 案例解析:分析三种饲料的营养价值之间有无显著性差别
  • 案例解析:分析不同实验室试制的纸张光滑度有无差异
  • 主成分分析与因子分析
  • 主成分分析概述
  • 使用SAS 实现主成分分析
  • 因子分析概述
  • 使用SAS 实现因子分析
  • 案例解析:我国某年经济发展情况的主成分分析
  • 案例解析:中国房地产经济区的研究分析
  • 聚类分析和判别分析
  • 聚类分析的概述
  • 划分法与层次法
  • 判别分析概述
  • 判别分析在SAS中的实现
  • 案例解析:聚类分析在客户定位中的应用研究
  • 案例解析:变量聚类在多指标系统评价中的应用
  • 案例解析:基于判别分析法的上市公司财务分析研究
  • LOGISTIC回归分析
  • 基本原理
  • 运用LOGISTIC过程拟合模型
  • LOGISTIC过程的其他语句
  • 建立模型
  • 案例解析:LOGISTIC回归用于上市公司ST预测

 

  • SAS数据挖掘流程
  • SAS 数据挖掘概述
  • 确定业务问题和数据准备
  • 数据抽样、探索与加工
  • 数据建模
  • 案例解析:X公司贷款业务案例分析
  • 案例解析:关联规则与购物篮问题分析
  • 案例解析对股票交易数据进行聚类分析
  • 案例解析:信用风险评分卡的开发与应用

 

第三部分  R语言实战

1.1、数据结构概述

1.2、向量

1.3、因子

1.4、矩阵

1.5、数据框

1.6、列表和函数

1.7、向量化计算和apply

2.1、线性回归的思想

2.2、回归结果的检查

2.3、决定系数 预测 和多元线性回归

2.4、一元线性回归演示

2.5、多项式回归演示

2.6、残差分析演示

2.7、多元线性回归演示

3.1、关联规则介绍

3.2、关联规则演示

4.1、决策树介绍C4.5

4.2、几种分类算法介绍

4.3、评价模型准确性