目录
第1章方程组求解与矩阵运算1
1.1线性方程组1
1.2向量的线性表示2
1.3向量空间3
1.4线性方程组解的结构4
1.5向量内积与正交化方法5
1.6行列式与矩阵7
1.7矩阵的线性运算、乘法运算8
1.8分块矩阵9
1.9矩阵的转置、逆矩阵及矩阵方程的求解11
1.10矩阵的秩12
1.11矩阵的行最简形13
1.12矩阵分解14
1.13特征值分解16
1.14小结18
1.15习题118
第2章矩阵的特征值和特征向量21
2.1矩阵的特征值与特征向量21
2.2相似矩阵23
2.3实对称矩阵的对角化24
2.4小结25
2.5习题225
第3章二次型与数值优化27
3.1二次型及其矩阵表示27
3.2二次型的标准形与惯性定律28
3.3正交变换二次型为标准形30
3.4数值优化算法33
3.5小结36
3.6习题336
第4章随机变量及其分布38
4.1random模块38
4.2离散型分布39
4.3连续型分布42
4.4小结44
4.5习题445
第5章随机变量的数字特征46
5.1平均数46
5.2中位数与众数47
5.3数学期望、方差与标准差48
5.4极差与四分位数49
5.5常见分布的数字特征50
5.6协方差与相关系数52
5.7k阶矩和变异系数53
5.8小结54
5.9习题554
第6章统计推断方法56
6.1最大似然估计56
6.2最大后验估计57
6.3蒙特卡洛方法58
6.4小结60
6.5习题660
第7章微分学基础61
7.1导数概念61
7.2基本函数的求导公式62
7.3求导法则63
7.4高阶导数与隐函数的导数63
7.5参数方程求导与多元函数的偏导数64
7.6梯度65
7.7小结67
7.8习题767
第8章微积分初步69
8.1导数与微分69
8.2微分的基本性质: 线性性质70
8.3链式法则与高阶微分70
8.4微分的应用: 局部线性逼近71
8.5积分72
8.6小结75
8.7习题875
第9章微分方程76
9.1常微分方程76
9.2偏微分方程78
9.3小结81
9.4习题981
第10章梯度方法与优化理论83
10.1梯度下降及其变种83
10.2Adam优化器86
10.3凸优化与非凸优化88
10.4拉格朗日乘子法与KKT条件90
10.5小结92
10.6习题1093
第11章时间序列分析94
11.1时间序列模型基础94
11.2自回归积分滑动平均模型95
11.3ARIMA模型的应用示例97
11.4小结99
11.5习题1199
第12章图论与离散数学100
12.1图的基本概念100
12.2最短路径问题100
12.3最小生成树104
12.4二分图106
12.5概率图模型108
12.6小结114
12.7习题12114
第13章信息论与编码理论115
13.1熵115
13.2互信息116
13.3KL散度和JS散度117
13.4哈夫曼编码119
13.5小结122
13.6习题13122
第14章信号分析与变换方法123
14.1傅里叶变换: 时域与频域的桥梁123
14.2小波变换: 时频联合分析126
14.3小结127
14.4习题14128
第15章深度学习数学基础129
15.1张量129
15.2激活函数132
15.3损失函数的设计与优化136
15.4反向传播算法138
15.5正则化方法140
15.6小结143
15.7习题15143
参考文献144
第3章常用数据集43
3.1小数据集43
3.1.1糖尿病数据集44
3.1.2手写数字数据集44
3.1.3鸢尾花数据集45
3.1.4体能训练数据集46
3.2大数据集47
3.2.1Olivetti人脸数据集48
3.2.220个新闻组数据集49
3.2.3LFW数据集与RCV1数据集50
3.2.4加州住房价格数据集51
3.2.5MNIST手写数字数据集53
3.3生成数据集53
3.3.1make_regression与make_blobs54
3.3.2make_classification55
3.3.3make_circles与make_moons数据集56
3.3.4瑞士卷57
3.4小结58
练习题58
第4章语料库60
4.1语料库概述60
4.2中文语料库61
4.3英文语料库61
4.3.1古腾堡语料库61
4.3.2网络文本语料库和即时消息聊天语料库63
4.3.3布朗语料库63
4.3.4路透社语料库65
4.3.5就职演讲语料库65
4.4文本语料库66
4.4.1文本语料库概述66
4.4.2文本语料库的结构67
4.5小结69
练习题69
第5章数据分析与可视化70
5.1NumPy70
5.1.1创建数组71
5.1.2算术运算与线性代数72
5.1.3通用函数74
5.1.4索引、切片和迭代75
5.1.5形状变换77
5.1.6堆叠与分割78
5.1.7广播78
5.2Pandas79
5.2.1Series79
5.2.2DataFrame81
5.3Matplotlib84
5.3.1绘制线图85
5.3.2中文字体87
5.3.3输出文本88
5.3.4绘制子图91
5.3.5饼图、散点图和直方图91
5.4小结93
练习题93
第6章中英文分词96
6.1英文分词96
6.2中文分词97
6.2.1基于词典的分词方法97
6.2.2基于统计模型的分词方法100
6.3中文分词工具102
6.4小结104
练习题104
第7章词性标注106
7.1标注语料库106
7.2字典108
7.3词性标注器110
7.3.1默认标注器110
7.3.2正则表达式标注器111
7.3.3查找标注器112
7.3.4Unigram标注器113
7.3.5Ngram标注器114
7.3.6组合标注器115
7.4小结116
练习题116
第8章特征工程 119
8.1特征缩放119
8.1.1特征归一化120
8.1.2特征标准化120
8.1.3特征鲁棒化121
8.1.4特征规范化122
8.2特征编码123
8.2.1独热编码123
8.2.2其他非数值数据编码124
8.3特征提取125
8.4小结127
练习题128
第9章文本分类129
9.1文本分类系统及其应用129
9.2文本预处理流程130
9.3应用举例132
9.3.1英文文本分类132
9.3.2中文文本分类134
9.4朴素贝叶斯137
9.5性能评价指标138
9.5.1混淆矩阵139
9.5.2准确率140
9.5.3精度、召回率和F1值140
9.5.4ROC曲线与AUC面积141
9.5.5分类报告143
9.6小结144
练习题145
第10章文本聚类147
10.1距离计算147
10.2聚类算法149
10.2.1K均值及其变体149
10.2.2其他聚类算法151
10.3应用举例153
10.4性能评价指标154
10.5小结156
练习题156
第11章机器翻译158
11.1机器翻译难在哪儿158
11.2文本对齐159
11.3动态规划160
11.4最小编辑距离161
11.5应用场景与翻译工具164
11.6小结165
练习题166
第12章文本信息提取167
12.1概述167
12.2命名实体识别及关系提取168
12.2.1名词短语块168
12.2.2标签模式170
12.3命名实体识别举例172
12.4分块器的构建与评估173
12.4.1最朴素分块器与正则表达式分块器173
12.4.2ngrams分块器174
12.5实体关系提取176
12.6关键词提取177
12.7小结178
练习题178
第13章情感分析180
13.1短语级的情感分析180
13.2语句级的情感分析182
13.3文档级的情感分析184
13.4主题或领域级的情感分析185
13.5应用举例186
13.6小结188
练习题188
第14章自然语言处理工具箱190
14.1NLTK190
14.2SpaCy192
14.3TextBlob194
14.4HanLP195
14.5Gensim196
14.6Jieba198
14.7小结200
练习题200
附录AJieba分词中常用的词性标签、对应的英文单词(或概念)以及详细的说明202附录B一些常用的NLTK词性标签及其含义204参考文献206
