数据挖掘原理(第3版)
深入探讨全新的数据挖掘技术,学习数据挖掘“黑匣子”内部原理。第2版的基础上扩展,透彻讲解适用于平稳数据的H-Tree算法等。

作者:[英]麦克斯·布拉默(Max Bramer) 著 王净 译

丛书名:计算机与智能科学丛书

定价:79.8元

印次:1-1

ISBN:9787302526810

出版日期:2019.09.01

印刷日期:2019.09.09

图书责编:王军

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

《数据挖掘原理(第3版)》深入探讨重要的数据挖掘技术。所谓数据挖掘,即从数据中自动提取隐含和潜在有用的信息;该技术正越来越多地用于商业、科学和其他应用领域。本书浓墨重彩地描述分类、关联规则挖掘和聚类。   普通读者可通过本书自学数据挖掘“黑匣子”内部的基本原理,并了解如何合理地选择商业数据挖掘包。学者和资深科研人员可通过本书了解最前沿技术并进一步推动该领域的发展。   本书在第2版的基础上进行扩展,透彻讲解适用于平稳数据的H-Tree算法,以及适用于时间相关数据(概念漂移)的CDH-Tree算法。

Max Bramer是英国朴次茅斯大学信息技术系荣誉教授、IFIP副主席、英国计算机学会AI专家组主席。自从 “数据挖掘”“数据库中的知识发现”“大数据”和“预测分析”等技术兴起以来,Max积极参与了多个数据挖掘项目,尤其是与数据自动分类相关的项目。Max发表了大量技术文章,曾撰写Research and Development in Intelligent Systems等著作。Max具有多年的本科和研究生教学经验。

前 言 《数据挖掘原理(第3版)》面向计算机科学、商业研究、市场营销、人工智能、生物信息学和法医学专业的学生,可用作本科生或硕士研究生的入门教材。同时,对于那些希望进一步提高自身能力的技术或管理人员来说,《数据挖掘原理(第3版)》也是一本极佳的自学书籍。《数据挖掘原理(第3版)》所涉及的内容远超一般的数据挖掘入门书籍。与许多其他书籍不同的是,在学习过程中你不需要拥有太多的数学知识即可理解相关内容。 数学是一种可以表达复杂思想的语言。遗憾的是,99%的人都无法很好地掌握这门语言;很多人很早就开始在学校学习一些基础知识,但学习过程往往充满曲折。 《数据挖掘原理(第3版)》涉及数学公式较少,将重点介绍相关概念。但遗憾的是,完全不使用数学符号是不可能的。附录A给出开始学习《数据挖掘原理(第3版)》需要掌握的所有内容。对于那些在学校学习数学的人来说,这些内容应该是非常熟悉的。掌握这些内容后,其他内容就较好理解了。如果觉得某些数学符号难以理解,通常可放心地忽略它们,只需要关注结果和给出的详细示例即可。而对于那些希望更深入理解数据挖掘的数学基础知识的人来说,可参考附录C中列出的内容。 过去,没有一本关于数据挖掘的入门书可使你具备该领域的研究水平——但现在,这样的日子已经过去了。《数据挖掘原理(第3版)》的重点是介绍基本技术,而不是展示当今最新的数据挖掘技术,因为大多数情况下,当拿到一《数据挖掘原理(第3版)》时,书中介绍的技术可能已被其他更新的技术取代了。一旦掌握了基本技术,你可通过多种渠道来了解该领域的最新进展。附录C列出一些常用资源,而其他附录包括有关《数据挖掘原理(第...

暂无课件

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
目    录

 

第 1 章  数据挖掘简介   1

1.1  数据爆炸   1

1.2  知识发现   2

1.3  数据挖掘的应用   3

1.4  标签和无标签数据   4

1.5  监督学习:分类   4

1.6  监督学习:数值预测   5

1.7  无监督学习:关联规则   6

1.8  无监督学习:聚类   7

第 2 章  用于挖掘的数据   9

2.1  标准制定   9

2.2  变量的类型   10

2.3  数据准备   11

2.4  缺失值   13

2.4.1  丢弃实例   13

2.4.2  用最频繁值/平均值替换   13

2.5  减少属性个数   14

2.6  数据集的UCI存储库   15

2.7  本章小结   15

2.8  自我评估练习   15

第 3 章  分类简介:朴素贝叶斯和最近邻算法   17

3.1  什么是分类   17

3.2  朴素贝叶斯分类器   18

3.3  最近邻分类   24

3.3.1  距离测量   26

3.3.2  标准化   28

3.3.3  处理分类属性   29

3.4  急切式和懒惰式学习   30

3.5  本章小结   30

3.6  自我评估练习   30

第 4 章  使用决策树进行分类   31

4.1  决策规则和决策树   31

4.1.1  决策树:高尔夫示例   31

4.1.2  术语   33

4.1.3  degrees数据集   33

4.2  TDIDT算法   36

4.3  推...

图书特色:
◆ 本书在详明实例的引导下,清晰阐述每个主题,将重点放在算法上;本书详细解释所涉及的数学基础知识,这样,即便你没有很强的数学或统计学背景,同样可理解本书的内容。
◆ 每章末尾提供练习题,供读者检验自己的知识掌握水平。附录中列出完整的术语表。
◆ 本书面向计算机科学、商业研究、市场营销、人工智能、生物信息学和法医学专业的学生,可用作本科和研究生教材。