目录
资源下载
第1章概述
1.1什么是机器学习
1.1.1有监督学习
1.1.2无监督学习
1.1.3自监督学习
1.1.4环境监督与强化学习
1.2机器学习的三个重要方面
1.2.1数据的表示
1.2.2模型的最优化
1.2.3模型的评估
1.3机器学习的历史与现状
1.4拓展阅读
1.5习题
第2章离散变量与分类
2.1K近邻(KNN)分类器
2.1.1KNN算法简介
2.1.2KNN算法的距离计算
2.1.3KNN算法的k值选择
2.1.4KNN算法的决策规则
2.1.5KNN算法小结
2.1.6KNN核心代码
2.1.7习题
2.2决策树
2.2.1决策树的决策过程
2.2.2决策树学习算法的基本流程
2.2.3划分属性的选择
2.2.4其他属性选取指标
2.2.5剪枝处理
2.2.6决策树的核心代码实现
2.2.7习题
2.3对数几率回归
2.3.1线性分类模型
2.3.2对数几率函数
2.3.3对数几率回归
2.3.4随机梯度下降
2.3.5与K近邻和决策树的比较
2.3.6对数几率回归的核心代码实现
2.3.7习题
2.4支持向量机
2.4.1二分类与决策面
2.4.2最大间隔分类器
2.4.3最优化问题的转换
2.4.4线性不可分的情况
2.4.5最优化问题的求解
2.4.6使用求解的SVM进行预测
2.4.7核函数与核方法
2.4.8软间隔SVM的核心代码实现
2.4.9拓展阅读
2.4.10习题
2.5神经网络
2.5.1全连接多层神经网络
2.5.2万能逼近定理
2.5.3学习算法
2.5.4关于可解释性的讨论
2.5.5全连接神经网络的核心代码实现
2.5.6应用到Mnist手写数字识别
2.5.7拓展阅读
2.6习题
第3章连续变量与线性回归
3.1基本线性回归
3.2岭回归
3.3基本线性回归的一个改进: 局部加权线性回归
3.4LASSO回归
3.5线性回归的核心代码实现
3.5.1基本线性回归
3.5.2局部加权线性回归
3.5.3岭回归
3.6习题
第4章维数灾难与降维
4.1基本概念
4.2主成分分析
4.2.1最大化投影方差推导
4.2.2最小化投影误差推导
4.2.3核心代码实现
4.3奇异值分解
4.3.1奇异值分解的公式
4.3.2奇异值分解的原理
4.3.3矩阵的SVD层级分解
4.3.4SVD的核心代码实现
4.4习题
第5章K均值聚类
5.1聚类分析概念
5.2Kmeans聚类算法的原理
5.3Kmeans聚类算法中k值的选取方式
5.4Kmeans聚类算法的优缺点
5.5Kmeans++聚类算法
5.6Kmeans聚类的核心代码实现
5.6.1Kmeans聚类算法
5.6.2二分Kmeans聚类算法
5.7习题
第6章生成模型与贝叶斯分类器
6.1贝叶斯最优分类器
6.2朴素贝叶斯分类器
6.3半朴素贝叶斯分类器和贝叶斯网
6.4朴素贝叶斯分类器核心代码实现
6.4.1词集与情绪分类
6.4.2词袋与垃圾邮件过滤
6.5习题
第7章自监督与大语言模型
7.1Transformer
7.1.1自注意力
7.1.2词嵌入
7.1.3位置编码
7.1.4编码器和解码器
7.2GPT与大语言模型的预训练
7.3拓展阅读
第8章环境监督与强化学习
8.1ChatGPT的三阶段训练流程
8.2强化学习的形式化
8.3策略最优化算法
8.3.1事后奖励
8.3.2基于优势函数的策略梯度
8.3.3近端策略最优化
8.4环境构建与训练奖励模型
8.5拓展阅读
第9章综合实验
9.1K近邻(KNN)分类器与手写数字识别任务
9.2决策树与隐形眼镜类型预测
9.3对率回归与预测病马死亡
9.4支持向量机与预测病马死亡
9.5全连接神经网络与Mnist手写数字识别
9.6线性回归与预测鲍鱼年龄
9.7PCA与数据压缩
9.8PCA与数据预处理
9.9PCA与特征脸
9.10奇异值分解与餐馆菜肴推荐
9.11Kmeans聚类与地理坐标聚类
9.12朴素贝叶斯与文本分类
附录kNN的最大后验概率解释
参考文献