





定价:49元
印次:1-1
ISBN:9787302653042
出版日期:2024.02.01
印刷日期:2024.01.26
图书责编:付潭蛟
图书分类:教材
本书以Python 3.9为数据分析与挖掘的工具,课程内容包括基础篇和综合篇。基础篇从Python基础知识出发,围绕数据分析与挖掘常用的科学计算包NumPy、数据处理包Pandas、数据可视化包Matplotlib以及机器学习库Scikit-learn进行理实一体化讲练;综合篇聚焦汽车、交通行业案例进行数据分析综合应用,包括新能源汽车运行数据分析、汽车贷款违约概率预测、航空公司客户价值分析,以及吉利汽车用户在线评论数据分析4个综合应用案例。 本书遵循从基础到综合应用、理论与实践一体化的编写原则,各章按照“案例驱动”编写模式,体验从问题求解到程序设计的转换过程,适合应用型本科高校工科类、管理类专业学生及其他Python数据分析与挖掘爱好者使用。
黄强,硕士研究生,讲师、高级信息系统项目管理师、高级数据分析师,从事高等教育教学工作近10年,现任吉利学院智能科技学院数据科学教研室负责人,主要授课《数据分析与挖掘》、《数据结构与算法》、《数据库原理与应用》,公开发表论文近10篇,其中SCI/SSCI双检索1篇,SSCI检索1篇,主持、参与省厅级、校级课题6项。
前言 当前是大数据的时代。各行各业的生产生活都会产生大量数据,大数据的获取与预处理、存储与管理、数据分析与建模,以及数据可视化等大数据应用越来越受到重视。Python基于面向对象、解释性、可移植性以及开源易学等特点进行数据分析与挖掘,容易入门,易于推广,是人们工作和生活的称手工具。 本书以应用为导向,遵循读者认知规律,从基础到综合应用,各章以“案例驱动”导入,遵从理论与实践一体化的编写原则。基础篇为第1~5章。第1章介绍数据分析与挖掘以及Python基础知识,使读者掌握数据分析与挖掘的联系与区别、Anaconda与Spyder的安装和使用方法、Python内置6种数据类型及常用操作、流程控制语句、函数定义与调用等基本编程方法;第2章介绍了Python用于科学计算与简单统计分析的NumPy包;第3章重点介绍了Python用于数据预处理与统计分析的Pandas包,利用Pandas包不仅可以进行数据读取与预处理,还能进行分组聚合、透视表、交叉表等统计分析;第4章主要介绍了Python用于数据可视化的Matplotlib包,主要包括数据可视化常见的图表、Matplotlib绘图流程以及典型基础图表、高级图表及3D图表的绘制;第5章介绍Python用于机器学习的Scikit-Learn库,包括数据预处理、数据降维、回归、分类、聚类相关的机器学习算法原理与应用。综合篇为第6~9章。每章对应一个综合案例,综合案例聚焦汽车、交通行业领域,包括新能源汽车运行数据分析、汽车贷款违约概率预测、航空公司客户价值分析,以及吉利汽车用户在线评论数据分析。各章案例讲解从需求分析、数据加载与预...
基 础 篇
第1章 Python数据分析与挖掘基础 3
1.1 数据分析与挖掘简介 3
1.2 Python开发环境 5
1.3 Python数据类型及常用操作 8
1.4 流程控制语句 13
1.5 函数定义与调用 16
本章小结 17
第2章 NumPy科学计算与分析 19
2.1 NumPy简介 19
2.2 数组的创建及常见操作 20
2.3 矩阵的创建及常见操作 27
2.4 NumPy统计分析 29
本章小结 36
第3章 Pandas数据处理与分析 37
3.1 Pandas简介 37
3.2 序列 37
3.3 数据框 45
3.4 外部文件读取 49
3.5 Pandas数据处理 53
3.6 Pandas数据分析 62
本章小结 69
第4章 Matplotlib数据可视化 71
4.1 数据可视化与Matplotlib简介 71
4.2 Matplotlib绘图基础 72
4.3 Matplotlib常见图表绘制 79
本章小结 88
第5章 Scikit-Learn机器学习 90
5.1 机器学习与Scikit-Learn简介 90
5.2 数据预处理与降维 92
5.3 回归分析 98
5.4 分类分析 101
5.5 聚类分析 110
本章小结 112
综合应用篇
第6章 新能源汽车运行数据分析 117
6.1 需求分析 117
6.2 数据加载与预处理 117
6.3 探索性数据...