前 言 习近平总书记指出:“数字技术正以新理念、新业态、新模式全面融入人类经 济、政治、文化、社会、生态文明建设各领域和全过程,给人类生产生活带来广 泛而深刻的影响。当前,世界百年变局和世纪疫情交织叠加,国际社会迫切需要 携起手来,顺应信息化、数字化、网络化、智能化发展趋势,抓住机遇,应对挑战。 ” 数据是数字经济时代最关键的基础性要素,中国信息通信研究院 2020年发布的 《大数据白皮书(2020年)》提到:国际权威机构 Statista的统计与预测认为 2035 年全球数据产生量预计达到2142ZB,全球数据量即将迎来更大规模的爆发。此时, 人们需要从海量的数据中捕获有用的信息,而数据可视化正是信息时代人们对逻 辑思维形象化需求的产物,是数据处理工作中的一个重要方面。 本书以 Tableau Desktop为主要工具,介绍 Tableau在数据分析与可视化方面的 主要应用:提供全新的数据模型、简化复杂的数据分析,使用户可以更轻松地跨 多个数据表分析复杂的业务问题。这些功能可大大提升企业的数据处理能力和分 析能力。本书主要包括十二个章节(建议 46~60学时),其中综合应用篇(建议 16学时)建议采用实训教学。各章内容具体如下: 第一章介绍数据可视化及 Tableau概述、常用的数据可视化软件、大数据时代 的挑战、大数据可视化的难点、可视化技术的新特性等,对整体数据可视化分析 进行初步介绍。建议安排 1学时。 第二章介绍 Tableau的新增功能、数据类型、运算符及优先级、软件安装、软件 界面等,帮助读者了解 Tableau基本操作。建议安排 1学时。 第三章介绍 Tableau连接文件和关系型数据库,包括 MicrosoftExcel、文本文件、 JSON文件、MicrosoftAccess、PDF文件等。建议安排 2~4学时。 第四章详细介绍 Tableau的基础操作,包括工作区、维度和度量及其转换、连 续和离散及其转换、数据及视图的导出等。建议安排 2~4学时。 第五章介绍使用 Tableau生成可视化视图的方法,包括简单视图和复杂视图。 建议安排 4学时。 第六章介绍创建仪表板的基本要求、仪表板及其创建、使用 Tableau创建故事 和共享可视化视图的步骤等。建议安排 4学时。 第七章介绍数据高级操作,包括创建和管理关系、数据排序等。建议安排 2~4 学时。 第八章介绍 Tableau的常用高级操作——数据分析表达式,包括使用函数、进 行表计算等。建议安排 2~4学时。 第九章介绍数据可视化中的数据处理,包括数据的基本概念、数据来源、数 据清洗、数据加工、数据抽样等。建议安排 2~4学时。 第十章介绍 Tableau中统计分析的可视化,包括相关分析、回归分析、聚类分析、 时间序列分析以及地理数据的可视化。建议安排 8~10学时。 第十一章介绍 Hadoop分布式文件系统,Tableau连接 ClouderaHadoop、MapRHadoop Hive的基本条件和主要步骤以及优化连接性能等。建议安排 2~4学时。 第十二章为综合应用篇,以工商管理类完整的数据分析为案例,并将 Python 与 Tableau的完美结合成果进行具体化展示。建议安排 16学时。 本书第一至四章、第七至十一章由重庆理工大学吴花平教授、硕士研究生汤 乐雯和宋飞编写,第五、六章由云南师范大学李圆蕊老师编写,第十二章由云南 大学刘金卓副教授和重庆理工大学朱谱熠副教授编写。本书的整体架构和软件技 术支持由重庆瀚海睿智大数据科技股份有限公司总裁陈继工程师提供。张雷、吴 祖松、张帆、徐加波、罗章涛参与全书的审校工作。 本书的出版得到了重庆理工大学研究生院的大力支持,并得到了重庆瀚海睿 智大数据科技股份有限公司提供的软件技术支持,同时,各位专家学者和编辑也 提出了许多宝贵的意见,在此一并表示衷心感谢!同时也向对本书的出版给予过 关心和支持的所有人致以衷心的感谢! 最后,竭诚希望广大读者对本书提出宝贵意见,以促使我们不断改进。由于 时间和编者水平有限,书中的疏漏和错误之处在所难免,敬请广大读者批评指正。 编者 2022年 10月