清华大学出版社--图书前言

图书前言

前言

如今，大数据已成为推动社会进步与产业升级的重要力量。从商业智能到科学研究，从城市管理到个人生活，大数据的应用无处不在，深刻改变着世界。然而，大数据需要经过精心的采集、预处理与可视化，才能转化为有价值的信息和知识。

本书基于这一背景，通过深入浅出的讲解和丰富的案例演示，帮助读者理解大数据的基本概念、生态系统和实际应用，数据采集、预处理与可视化的各个环节，以及如何使用Python编程语言来实现这些过程。

本书共5部分。在基础理论部分，将带领读者走进大数据的世界，了解大数据的基本概念、特征、发展历史、生态系统及实际应用；在数据采集部分，将详细介绍数据采集的基本概念、特征、方法和技术，并重点讲解如何使用Python进行网络数据采集，包括网络爬虫基础及Scrapy框架和Selenium库的应用；在数据预处理部分，将深入探讨数据清理、数据集成、数据归约、数据转换等关键技术，并介绍如何使用NumPy和Pandas这两个强大的Python库来进行数据预处理；在数据可视化部分，将讲解数据可视化的发展历史、分类和应用，并展示如何使用Matplotlib等Python库来绘制各种类型的图表，从而直观展示数据的内在规律和趋势；在案例部分，将展示使用Python进行数据采集、预处理与可视化的全过程。通过阅读本书，读者将能够掌握数据处理与分析的核心技能，提升数据素养和数据分析能力，为未来的职业发展打下坚实的基础。

本书的作者为吕云翔、姚泽良、宗坚、杨壮、韩延刚、仇善召、朱英豪、张扬，此外，曾洪立参与了部分内容的编写并进行了素材整理及配套资源制作等。

由于作者水平和能力有限，本书难免有疏漏之处。恳请各位同仁和广大读者给予批评指正，也希望各位读者将实践过程中的经验和心得与我们交流。

作者2025年5月

关于我们

新闻资讯

服务支持

关于我们

新闻资讯

服务支持

图书前言