人工智能(Artificial Intelligence,AI)与数据分析的结合正在深刻改变着人们理解和利用数据的方式。在数据爆炸的时代,传统的数据分析方法已经难以应对海量、多元、复杂的数据处理需求。AI技术的引入不仅可以大幅提升数据处理的效率和准确性,更重要的是让数据分析从“人工驱动”转向“智能驱动”,从而实现从描述性分析向预测性分析和决策性分析的跨越。
随着ChatGPT、DeepSeek、通义千问等大语言模型的快速发展,AI技术变得越来越普及,也越来越易于使用。企业和个人都能够以更低的成本、更高的效率处理复杂的数据分析任务。从文本挖掘到图像识别,从语音分析到视频理解……AI正在打破数据类型的边界,让多模态数据分析成为现实。这不仅是技术的进步,更是数据科学领域的一次革命性变革。
笔者作为长期从事数据分析工作的实践者,深深地感受到了AI技术带来的巨大变化。几年前,处理一个包含数万条文本数据的情感分析项目,需要几周时间进行数据清洗并完成特征工程和模型训练。而如今,借助DeepSeek等AI大模型,同样的任务可能只需要几小时就能完成,而且准确率和洞察深度都有显著的提升。
在实际项目中,AI大模型不仅是一个工具,而且是一个智能数据分析助手。它能够理解复杂的业务需求并自动生成代码,甚至可以提供创新的分析思路。这种人机协作的模式让数据分析师能够将更多的精力集中在理解业务本身,而不是陷入烦琐的技术细节。同时,AI的引入也大大降低了数据分析的门槛,让更多非技术背景的业务人员能够参与数据驱动的决策过程。
本书特色
? 理论结合实践:既系统地介绍AI与数据分析的基础理论知识,又给出大量的实战案例,确保读者能够学以致用。
? 全面覆盖工具:涵盖DeepSeek、ChatGPT和通义千问等主流AI工具,从网页版的使用到API的调用,从单一功能到系统集成,对涉及的技术栈进行系统的介绍。
? 数据类型多样:不仅介绍传统的结构化数据分析,而且深入探讨基于AI的文本、图像、音频和视频等多媒体数据分析方法。
? 应用场景丰富:涉及的核心技术均给出具体应用场景,如舆情监控、欺诈检测、智能客服等,帮助读者理解技术的实际应用价值。
? 提供完整代码:提供从简单示例到综合案例的完整代码,并对代码进行详细的注释与讲解,方便读者运行和修改,从而快速上手实践。
本书内容
第1篇 AI数据分析基础
第1章数据分析概述,介绍数据分析的基本概念、流程和传统方法,为后续引入AI技术进行数据分析奠定基础。
第2章AI与数据分析的融合,探讨AI在数据分析中的角色定位,比较主流AI工具的特点和应用场景。
第2篇 AI数据分析与可视化应用实践
第3章基于AI的结构化数据分析,详细介绍AI大模型DeepSeek(包括网页版和API两种方式)在数据生成、预处理和分析中的应用。
第4章基于AI的文本数据分析,详细介绍如何使用AI进行文本摘要、情感分析、文本分类、主题总结、命名实体识别和机器翻译等,并给出完整的应用场景。
第5章基于AI的多媒体数据分析,基于通义大模型,展示如何使用AI进行图像、音频、视频等多媒体数据的分析,从而构建完整的多媒体数据处理系统。
第6章基于AI Agent的自动化数据分析,首先介绍AI Agent的概念和应用,然后通过Manus等工具进行自动化数据分析,并引领读者构建自己的AI Agent系统。
第7章基于AI的数据可视化,结合实际应用案例,详细介绍如何利用AI技术进行数据可视化。
读者对象
? 想提升数据分析效率和洞察深度的数据分析师、数据科学家;
? 想了解AI在数据分析领域具体应用场景和实现方法的技术人员;
? 需要用AI进行数据驱动决策的业务分析师和产品经理;
? 想了解AI数据分析技术的商业价值和实施路径的企业管理者和决策者;
? 想用AI提供数据分析服务或开发相关产品的自由职业者和创业者;
? 高等院校计算机科学和数据科学等相关专业的学生与老师;
? AI数据分析培训机构的学员和讲师。
配套资源获取方式
本书涉及的源代码等配套资源有两种获取方式:一是关注微信公众号“方大卓越”,私信发送数字“59”自动获取下载链接;二是在清华大学出版社网站(www.tup.com.cn)上搜索到本书,然后在本书页面上找到“资源下载”栏目,单击“网络资源”按钮进行下载。
售后支持
由于笔者水平有限,加之写作时间仓促,书中可能存在疏漏与不足之处,恳请广大读者批评与指正。读者在阅读本书的过程中如果有疑问,可以发送电子邮件获取帮助。
刘洋
2026年3月
