48课时
课程将介绍数据挖掘原理、SPSS Modeler数据挖掘软件的基本操作和环境;学习如何使用SPSS Modeler读取,处理数据
培训人员能够掌握数据挖掘理论和常用的建模技术、掌握机器学习的常见技术,比如神经网络、决策树等,并将其应用到具体业务操作中
课程基于SAS工具进行数据分析和挖掘
将各种类型的数据读入SAS数据集中
对SAS数据集进行校验和清洗
创建SAS变量和数据子集
合并SAS数据集
创建增强列表和总结报表
R语言作为一种数据分析专业语言,是当今数据科学领域最流行的开源编程语言之一,在数据分析与机器学习领域已经成为一款最重要的工具。精通R语言的数据分析师是企业竞相争抢的高薪人才。
R语言实战课程采用MBA式的案例教学,结合统计理论,建模方法论、R语言编程和老师的丰富实际项目经验,力求让每一个学生都能够把学到的知识运用到实际工作中去。我们精选的案例是目前企业真实场景下应用很广泛的场景,集合了互联网用户分析、精准营销、风险评估、BI设计与实施等领域的数据挖掘实例,对您从事真正的数据分析工作有针对性的指导与帮助。
1.1、数据结构概述
1.2、向量
1.3、因子
1.4、矩阵
1.5、数据框
1.6、列表和函数
1.7、向量化计算和apply
2.1、线性回归的思想
2.2、回归结果的检查
2.3、决定系数 预测 和多元线性回归
2.4、一元线性回归演示
2.5、多项式回归演示
2.6、残差分析演示
2.7、多元线性回归演示
3.1、关联规则介绍
3.2、关联规则演示
4.1、决策树介绍C4.5
4.2、几种分类算法介绍
4.3、评价模型准确性