时间 |
内容 |
案例实践与练习 |
Day1初识机器学习
上午
概述入门
数据预处理 |
概述(第一天——1)
1、 概念与术语(人工智能、数据挖掘、机器学习)
2、 数据挖掘的对象
3、 数据挖掘的关键技术
4、 知识的表达
5、 Python的安装
数据预处理(第一天——2)
1、 数据清理
2、 规范化
3、 模糊集
4、 粗糙集
5、 无标签时:PCA
6、 有标签时:Fisher线性判别
数据压缩(DFT、小波变换) |
案例实践:
1、 python安装
2、 Tensorflow安装
3、 PCA的实验
4、 DFT的实验 |
Day1初识机器学习
下午
回归与时序分析
决策树 |
回归与时序分析 (第一天——3)
1、 线性回归
2、 非线性回归
3、 logistics回归
4、 平稳性、截尾与拖尾
5、 ARIMA
决策树(第一天——4)
1、 分类和预测
2、 熵减过程与贪心法
3、 ID3
4、 C4.5
5、 其他改进方法
决策树剪枝 |
案例实践:
1、 回归的实验
2、 ARIMA预测实验
3、 决策树的实验
|
Day2机器学习中的典型算法
上午
聚类
关联规则
朴素贝叶斯与KNN |
聚类(第二天——1)
1、 监督学习与无监督学习
2、 K-means与k-medoids
3、 层次的方法
4、 基于密度的方法
5、 基于网格的方法
6、 孤立点分析
关联规则(第二天——2)
1、 频繁项集
2、 支持度与置信度
3、 提升度
4、 Apriori性质
5、 连接与剪枝
朴素贝叶斯与KNN(第二天——3)
1、 KNN
2、 概率论基础:条件概率、联合概率、分布、共轭先验。
3、 “概率派”与“贝叶斯派”
4、 朴素贝叶斯模型
|
案例实践:
1、 鸢尾花数据的聚类
2、 超市购物篮——关联规则分析
3、 朴素贝叶斯案例:皮马印第安人患糖尿病的风险 |
Day2机器学习中的典型算法
下午
极大似然估计与EM算法
性能评价指标 |
极大似然估计与EM算法(第二天——4)
1、 极大似然估计
2、 对数似然函数
3、 EM算法
性能评价指标(第二天——5)
1、 准确率;精确率、召回率;F1
2、 真阳性率、假阳性率
3、 混淆矩阵
4、 ROC与AUC
5、 对数损失
6、 Kappa系数
7、 回归:平均绝对误差、平均平方误差
8、 聚类:兰德指数、互信息
9、 k折验证 |
案例实践:
1、 正态分析的参数估计
2、 EM算法应用案例:双正态分布的参数估计
3、 绘制ROC并计算AUC、F1
4、 绘制拟合曲线,计算拟合优度 |
Day3神经网络专题
上午
BP神经网络
模拟退火算法与其他神经网络 |
BP神经网络 (第三天——1)
1、 人工神经元及感知机模型
2、 前向神经网络
3、 sigmoid
4、 径向基函数神经网络
5、 误差反向传播
模拟退火算法与其他神经网络 (第三天——2)
1、 模拟退火算法
2、 Hopfield网络
3、 自组织特征映射神经网络(SOM)
4、 受限布尔兹曼机 |
案例实践:
1、 可以手算的神经网络
2、 神经网络模拟一个圆锥曲面
3、 “货郎担”问题(模拟退火算法)
4、 识别破损的字母(Hopfield网络)
5、 聚类的另一种解法(SOM) |
Day3神经网络专题
下午
机器学习中的最优化方法
遗传算法 |
机器学习中的最优化方法(第三天——3)
1、 参数学习方法
2、 损失函数(或目标函数)
3、 梯度下降
4、 随机梯度下降
5、 牛顿法
6、 拟牛顿法
遗传算法 (第三天——4)
1、 种群、适应性度量
2、 交叉、选择、变异
3、 基本算法 |
案例实践:
1、 随机梯度下降的例子
2、 牛顿法求Rosenbrock(香蕉函数)的极值
3、 “同宿舍”问题:遗传算法
|
Day4机器学习进阶
上午
支持向量机
隐马尔科夫模型 |
支持向量机 (第四天——1)
1、 统计学习问题
2、 支持向量机
3、 核函数
4、 多分类的支持向量机
5、 用于连续值预测的支持向量机
隐马尔科夫模型(第四天——2)
1、 马尔科夫过程
2、 隐马尔科夫模型
3、 三个基本问题(评估、解码、学习)
4、 前向-后向算法
5、 Viterbi算法
6、 Baum-Welch算法
|
案例实践:
1、 SVM:iris的三个分类
2、 HMM示例:天气与地表积水、罐中的彩球
3、 HMM之前向算法:掷骰子的序列
4、 HMM之viterbi算法:是否生病了? |
Day4机器学习进阶
下午
文本挖掘
从LSA到LDA |
文本挖掘(第四天——3)
1、文本分析功能
2、文本特征的提取
4、TF-IDF
5、文本分类
5、文本聚类
从LSA到LDA(第四天——3)
1、 LSA
2、 pLSA
3、 LDA
|
案例实践:
1、 英文文本分析;
2、 中文文本分析:《绝代双骄》
3、 中文语句情感分析
4、 LSA和LDA的比较
|
Day5机器学习进阶与深度学习初步
上午
利用无标签的样本
集成学习 |
利用无标签的样本(第五天——1)
1、 半监督学习
2、 直推式学习
3、 主动学习
集成学习(第五天——2)
1、 bagging
2、 co-training
3、 adaboost
4、 随机森林
5、 GBDT |
案例实践:
1、 半监督学习:SVM标签扩展;
2、 主动学习:手写数字
3、bagging、adaboost、RF、GBDT的例子 |
Day5机器学习进阶与深度学习初步
下午
强化学习
深度学习-1 |
强化学习(第五天——3)
1、 agent的属性
2、 exploration and exploitation
3、 Bellman期望方程
4、 最优策略
5、 策略迭代与价值迭代
6、 Q学习算法
深度学习-1(第五天——4)
1、 连接主义的兴衰
2、 深度学习与神经网络的区别与联系
3、 目标函数
4、 激励函数
学习步长 |
案例实践:
1、 强化学习示例:走迷宫
2、 强化学习:谷底的小车
3、 深度学习示例:模式识别 |
Day6深度学习
上午
深度学习-2
深度学习-3 |
深度学习-2(第六天——1)
1、 优化算法
2、 Adagrad
3、 RMSprop
4、 Adam
5、 避免过适应
深度学习-3(第六天——2)
1、 典型应用场景
2、 CNN
3、 各种CNN
4、 RNN
LSTM、GRU |
案例实践:
1、 CNN的准备示例
2、 CNN处理MNIST手写数字数据集
3、 RNN准备示例
4、 RNN分析股票趋势
5、 LSTM的准备示例
|
Day6深度学习
下午
深度学习-4 |
1、 GAN
2、 DQN
|
案例实践:
1、 DQN结合CNN:“flappy bird” |