图书前言

前言

 

 

当前是大数据的时代。各行各业的生产生活都会产生大量数据,大数据的获取与预处理、存储与管理、数据分析与建模,以及数据可视化等大数据应用越来越受到重视。Python基于面向对象、解释性、可移植性以及开源易学等特点进行数据分析与挖掘,容易入门,易于推广,是人们工作和生活的称手工具。

本书以应用为导向,遵循读者认知规律,从基础到综合应用,各章以“案例驱动”导入,遵从理论与实践一体化的编写原则。基础篇为第1~5章。第1章介绍数据分析与挖掘以及Python基础知识,使读者掌握数据分析与挖掘的联系与区别、Anaconda与Spyder的安装和使用方法、Python内置6种数据类型及常用操作、流程控制语句、函数定义与调用等基本编程方法;第2章介绍了Python用于科学计算与简单统计分析的NumPy包;第3章重点介绍了Python用于数据预处理与统计分析的Pandas包,利用Pandas包不仅可以进行数据读取与预处理,还能进行分组聚合、透视表、交叉表等统计分析;第4章主要介绍了Python用于数据可视化的Matplotlib包,主要包括数据可视化常见的图表、Matplotlib绘图流程以及典型基础图表、高级图表及3D图表的绘制;第5章介绍Python用于机器学习的Scikit-Learn库,包括数据预处理、数据降维、回归、分类、聚类相关的机器学习算法原理与应用。综合篇为第6~9章。每章对应一个综合案例,综合案例聚焦汽车、交通行业领域,包括新能源汽车运行数据分析、汽车贷款违约概率预测、航空公司客户价值分析,以及吉利汽车用户在线评论数据分析。各章案例讲解从需求分析、数据加载与预处理、数据分析与建模及数据可视化4个步骤相对完整地进行,使读者可以全面地掌握应用Python进行具体领域的数据分析与挖掘的方法。

本书的出版得到了吉利学院“教学质量工程”(校级品牌课程项目)的资助。本书所有程序均采用Anaconda3集成的Spyde(Python 3.9)进行编写且全部编译通过。书中所有章节教学大纲、课件、案例数据、程序代码、思政元素目录、即测即练题库等配套资源均由清华大学出版社提供下载方式。由于编者水平有限,加之时间仓促,书中难免会有疏漏之处,恳请广大读者批评指正,将意见反馈至邮箱:1450691104@qq.com。

                                     

编  者

2023年6月