图书前言

前    言

《数据挖掘原理(第3版)》面向计算机科学、商业研究、市场营销、人工智能、生物信息学和法医学专业的学生,可用作本科生或硕士研究生的入门教材。同时,对于那些希望进一步提高自身能力的技术或管理人员来说,《数据挖掘原理(第3版)》也是一本极佳的自学书籍。《数据挖掘原理(第3版)》所涉及的内容远超一般的数据挖掘入门书籍。与许多其他书籍不同的是,在学习过程中你不需要拥有太多的数学知识即可理解相关内容。

数学是一种可以表达复杂思想的语言。遗憾的是,99%的人都无法很好地掌握这门语言;很多人很早就开始在学校学习一些基础知识,但学习过程往往充满曲折。

《数据挖掘原理(第3版)》涉及数学公式较少,将重点介绍相关概念。但遗憾的是,完全不使用数学符号是不可能的。附录A给出开始学习《数据挖掘原理(第3版)》需要掌握的所有内容。对于那些在学校学习数学的人来说,这些内容应该是非常熟悉的。掌握这些内容后,其他内容就较好理解了。如果觉得某些数学符号难以理解,通常可放心地忽略它们,只需要关注结果和给出的详细示例即可。而对于那些希望更深入理解数据挖掘的数学基础知识的人来说,可参考附录C中列出的内容。

过去,没有一本关于数据挖掘的入门书可使你具备该领域的研究水平——但现在,这样的日子已经过去了。《数据挖掘原理(第3版)》的重点是介绍基本技术,而不是展示当今最新的数据挖掘技术,因为大多数情况下,当拿到一《数据挖掘原理(第3版)》时,书中介绍的技术可能已被其他更新的技术取代了。一旦掌握了基本技术,你可通过多种渠道来了解该领域的最新进展。附录C列出一些常用资源,而其他附录包括有关《数据挖掘原理(第3版)》示例中使用的主要数据集的信息,供你在自己的项目中使用。此外附录D包括技术术语表。

为便于检查对所学知识的掌握情况,每章都包含自我评估练习。参考答案见附录E。

另外说明一下,《数据挖掘原理(第3版)》涉及大量数据集、属性和值,也涉及不少数学公式,字母繁多,格式复杂。为保证全书的科学性和严谨性,中文书中,字母的正斜体与英文原书基本保持统一。

书末列出全书各章正文中引用的参考文献。读者在阅读正文时,会不时看到引用;引用的形式为[*],其中*为数字编号。遇到此类引用时,读者可跳转到书末,查阅相关信息。