目 录
基 础 篇
第1章 Python数据分析与挖掘基础 3
1.1 数据分析与挖掘简介 3
1.2 Python开发环境 5
1.3 Python数据类型及常用操作 8
1.4 流程控制语句 13
1.5 函数定义与调用 16
本章小结 17
第2章 NumPy科学计算与分析 19
2.1 NumPy简介 19
2.2 数组的创建及常见操作 20
2.3 矩阵的创建及常见操作 27
2.4 NumPy统计分析 29
本章小结 36
第3章 Pandas数据处理与分析 37
3.1 Pandas简介 37
3.2 序列 37
3.3 数据框 45
3.4 外部文件读取 49
3.5 Pandas数据处理 53
3.6 Pandas数据分析 62
本章小结 69
第4章 Matplotlib数据可视化 71
4.1 数据可视化与Matplotlib简介 71
4.2 Matplotlib绘图基础 72
4.3 Matplotlib常见图表绘制 79
本章小结 88
第5章 Scikit-Learn机器学习 90
5.1 机器学习与Scikit-Learn简介 90
5.2 数据预处理与降维 92
5.3 回归分析 98
5.4 分类分析 101
5.5 聚类分析 110
本章小结 112
综合应用篇
第6章 新能源汽车运行数据分析 117
6.1 需求分析 117
6.2 数据加载与预处理 117
6.3 探索性数据分析 122
6.4 电池健康状态可视化 124
6.5 能耗预测 131
本章小结 135
第7章 汽车贷款违约概率预测 136
7.1 需求分析 136
7.2 数据加载、清洗与分析 136
7.3 预测模型构建与评估 146
7.4 预测可视化 148
本章小结 149
第8章 航空公司客户价值分析 151
8.1 需求分析与数据加载 152
8.2 数据预处理 153
8.3 数据K-均值聚类 156
8.4 价值分析可视化 157
本章小结 159
第9章 吉利汽车用户在线评论数据分析 160
9.1 需求分析 160
9.2 数据加载与预处理 161
9.3 词云图可视化分析 165
9.4 关键词共现分析 167
本章小结 170