图书目录

目录

第1章方程组求解与矩阵运算1

1.1线性方程组1

1.2向量的线性表示2

1.3向量空间3

1.4线性方程组解的结构4

1.5向量内积与正交化方法5

1.6行列式与矩阵7

1.7矩阵的线性运算、乘法运算8

1.8分块矩阵9

1.9矩阵的转置、逆矩阵及矩阵方程的求解11

1.10矩阵的秩12

1.11矩阵的行最简形13

1.12矩阵分解14

1.13特征值分解16

1.14小结18

1.15习题118

第2章矩阵的特征值和特征向量21

2.1矩阵的特征值与特征向量21

2.2相似矩阵23

2.3实对称矩阵的对角化24

2.4小结25

2.5习题225

第3章二次型与数值优化27

3.1二次型及其矩阵表示27

3.2二次型的标准形与惯性定律28

3.3正交变换二次型为标准形30

3.4数值优化算法33

3.5小结36

3.6习题336

第4章随机变量及其分布38

4.1random模块38

4.2离散型分布39

4.3连续型分布42

4.4小结44

4.5习题445

第5章随机变量的数字特征46

5.1平均数46

5.2中位数与众数47

5.3数学期望、方差与标准差48

5.4极差与四分位数49

5.5常见分布的数字特征50

5.6协方差与相关系数52

5.7k阶矩和变异系数53

5.8小结54

5.9习题554

第6章统计推断方法56

6.1最大似然估计56

6.2最大后验估计57

6.3蒙特卡洛方法58

6.4小结60

6.5习题660

第7章微分学基础61

7.1导数概念61

7.2基本函数的求导公式62

7.3求导法则63

7.4高阶导数与隐函数的导数63

7.5参数方程求导与多元函数的偏导数64

7.6梯度65

7.7小结67

7.8习题767

第8章微积分初步69

8.1导数与微分69

8.2微分的基本性质: 线性性质70

8.3链式法则与高阶微分70

8.4微分的应用: 局部线性逼近71

8.5积分72

8.6小结75

8.7习题875

第9章微分方程76

9.1常微分方程76

9.2偏微分方程78

9.3小结81

9.4习题981

第10章梯度方法与优化理论83

10.1梯度下降及其变种83

10.2Adam优化器86

10.3凸优化与非凸优化88

10.4拉格朗日乘子法与KKT条件90

10.5小结92

10.6习题1093

第11章时间序列分析94

11.1时间序列模型基础94

11.2自回归积分滑动平均模型95

11.3ARIMA模型的应用示例97

11.4小结99

11.5习题1199

第12章图论与离散数学100

12.1图的基本概念100

12.2最短路径问题100

12.3最小生成树104

12.4二分图106

12.5概率图模型108

12.6小结114

12.7习题12114

第13章信息论与编码理论115

13.1熵115

13.2互信息116

13.3KL散度和JS散度117

13.4哈夫曼编码119

13.5小结122

13.6习题13122

第14章信号分析与变换方法123

14.1傅里叶变换: 时域与频域的桥梁123

14.2小波变换: 时频联合分析126

14.3小结127

14.4习题14128

第15章深度学习数学基础129

15.1张量129

15.2激活函数132

15.3损失函数的设计与优化136

15.4反向传播算法138

15.5正则化方法140

15.6小结143

15.7习题15143

参考文献144

第3章常用数据集43

3.1小数据集43

3.1.1糖尿病数据集44

3.1.2手写数字数据集44

3.1.3鸢尾花数据集45

3.1.4体能训练数据集46

3.2大数据集47

3.2.1Olivetti人脸数据集48

3.2.220个新闻组数据集49

3.2.3LFW数据集与RCV1数据集50

3.2.4加州住房价格数据集51

3.2.5MNIST手写数字数据集53

3.3生成数据集53

3.3.1make_regression与make_blobs54

3.3.2make_classification55

3.3.3make_circles与make_moons数据集56

3.3.4瑞士卷57

3.4小结58

练习题58

第4章语料库60

4.1语料库概述60

4.2中文语料库61

4.3英文语料库61

4.3.1古腾堡语料库61

4.3.2网络文本语料库和即时消息聊天语料库63

4.3.3布朗语料库63

4.3.4路透社语料库65

4.3.5就职演讲语料库65

4.4文本语料库66

4.4.1文本语料库概述66

4.4.2文本语料库的结构67

4.5小结69

练习题69

第5章数据分析与可视化70

5.1NumPy70

5.1.1创建数组71

5.1.2算术运算与线性代数72

5.1.3通用函数74

5.1.4索引、切片和迭代75

5.1.5形状变换77

5.1.6堆叠与分割78

5.1.7广播78

5.2Pandas79

5.2.1Series79

5.2.2DataFrame81

5.3Matplotlib84

5.3.1绘制线图85

5.3.2中文字体87

5.3.3输出文本88

5.3.4绘制子图91

5.3.5饼图、散点图和直方图91

5.4小结93

练习题93

第6章中英文分词96

6.1英文分词96

6.2中文分词97

6.2.1基于词典的分词方法97

6.2.2基于统计模型的分词方法100

6.3中文分词工具102

6.4小结104

练习题104

第7章词性标注106

7.1标注语料库106

7.2字典108

7.3词性标注器110

7.3.1默认标注器110

7.3.2正则表达式标注器111

7.3.3查找标注器112

7.3.4Unigram标注器113

7.3.5Ngram标注器114

7.3.6组合标注器115

7.4小结116

练习题116

第8章特征工程 119

8.1特征缩放119

8.1.1特征归一化120

8.1.2特征标准化120

8.1.3特征鲁棒化121

8.1.4特征规范化122

8.2特征编码123

8.2.1独热编码123

8.2.2其他非数值数据编码124

8.3特征提取125

8.4小结127

练习题128

第9章文本分类129

9.1文本分类系统及其应用129

9.2文本预处理流程130

9.3应用举例132

9.3.1英文文本分类132

9.3.2中文文本分类134

9.4朴素贝叶斯137

9.5性能评价指标138

9.5.1混淆矩阵139

9.5.2准确率140

9.5.3精度、召回率和F1值140

9.5.4ROC曲线与AUC面积141

9.5.5分类报告143

9.6小结144

练习题145

第10章文本聚类147

10.1距离计算147

10.2聚类算法149

10.2.1K均值及其变体149

10.2.2其他聚类算法151

10.3应用举例153

10.4性能评价指标154

10.5小结156

练习题156

第11章机器翻译158

11.1机器翻译难在哪儿158

11.2文本对齐159

11.3动态规划160

11.4最小编辑距离161

11.5应用场景与翻译工具164

11.6小结165

练习题166

第12章文本信息提取167

12.1概述167

12.2命名实体识别及关系提取168

12.2.1名词短语块168

12.2.2标签模式170

12.3命名实体识别举例172

12.4分块器的构建与评估173

12.4.1最朴素分块器与正则表达式分块器173

12.4.2ngrams分块器174

12.5实体关系提取176

12.6关键词提取177

12.7小结178

练习题178

第13章情感分析180

13.1短语级的情感分析180

13.2语句级的情感分析182

13.3文档级的情感分析184

13.4主题或领域级的情感分析185

13.5应用举例186

13.6小结188

练习题188

第14章自然语言处理工具箱190

14.1NLTK190

14.2SpaCy192

14.3TextBlob194

14.4HanLP195

14.5Gensim196

14.6Jieba198

14.7小结200

练习题200

附录AJieba分词中常用的词性标签、对应的英文单词(或概念)以及详细的说明202附录B一些常用的NLTK词性标签及其含义204参考文献206