数据挖掘原理(第4版)
国际信息处理联合会(FIP)副主席、英国计算机学会AI专家组主席Max Bramer倾情分享:解释、探索了数据挖掘的主要技术,可以从数据中自动提取隐式和潜在有用的信息。

作者:[英] 麦克斯·布拉默(Max Bramer)著 李晓峰 逄金辉 译

丛书名:计算机与智能科学丛书

定价:118元

印次:1-1

ISBN:9787302596493

出版日期:2022.01.01

印刷日期:2021.12.20

图书责编:王军

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

《数据挖掘原理(第4版)》解释、探索了数据挖掘的主要技术,可以从数据中自动提取隐式和潜在有用的信息。数据挖掘越来越多地用于商业、科学和其他应用领域,它侧重于分类、关联规则挖掘和聚类。   书中对每个主题都进行了清晰的解释,重点是算法而不是数学公式,并通过详细的有效示例加以说明。本书是为没有强数学或统计学背景的读者写的,并详细解释了使用的所有公式。   《数据挖掘原理(第4版)》适合作为本科生或研究生层次的教材,适用专业包括计算机科学、商业研究、市场营销、人工智能、生物信息学和法医学。   为了帮助读者自学,本书旨在帮助普通读者理解什么是“黑盒”,这样他们就可以有差别地使用商业数据挖掘包,高级读者或学术研究者可以对未来该领域的技术进步做出贡献。   书中每一章都有实践练习,让读者检查自己的进度。附录还包括所使用的技术术语的完整术语表。   数据挖掘原理包括对流数据分类算法的介绍,包括平稳数据(底层模型是固定的)和依赖时间的数据(底层模型不时变化)——这种现象称为概念漂移。   《数据挖掘原理(第4版)》提供了前馈神经网络与反向传播的详细描述,并显示它如何可以用于分类。

麦克斯·布拉默(Max Bramer),朴次茅斯大学信息技术系荣休教授、国际信息处理联合会(IFIP)副主席、英国计算机学会AI专家组主席。自20世纪80年代以来,麦克斯教授一直积极参与“数据挖掘”领域的研究,该领域后来也被称为“数据库知识发现”和“大数据和预测分析”。麦克斯教授完成了多个数据挖掘项目,特别是关于数据自动分类的项目,并在技术文献中发表了大量文章。麦克斯教授拥有多年为本科生和研究生讲授“数据挖掘”这门课程的经验。

前 言 《数据挖掘原理(第4版)》面向计算机科学、商业研究、市场营销、人工智能、生物信息学和法医学专业的学生,可用作本科生或硕士研究生的入门教材。同时,对于那些希望进一步提高自身能力的技术或管理人员来说,《数据挖掘原理(第4版)》也是极佳的自学书籍。《数据挖掘原理(第4版)》所涉及的内容远超一般的数据挖掘入门书籍。与许多其他书籍不同的是,在学习《数据挖掘原理(第4版)》的过程中你不需要拥有太多的数学知识即可理解其中的相关内容。 数学是一种可以表达复杂思想的语言。遗憾的是,99%的人都无法很好地掌握这门语言;很多人很早就开始在学校学习一些基础知识,但学习过程往往充满曲折。作者以前是一位数学家,他现在喜欢在任何可能的情况下用简单的英语交流,并相信好例子胜过一百个数学符号。 《数据挖掘原理(第4版)》涉及数学公式较少,将重点介绍相关概念。但是,完全不使用数学符号是不可能的。附录A给出开始学习《数据挖掘原理(第4版)》需要掌握的所有内容。对于那些在学校学习数学的人来说,这些内容应该是非常熟悉的。掌握这些内容后,其他内容就较好理解了。如果觉得某些数学符号难以理解,通常可放心地忽略它们,只需要关注结果和给出的详细示例即可。而对于那些希望更深入理解数据挖掘的数学基础知识的人来说,可参考附录C中列出的内容。 过去,没有一本关于数据挖掘的入门书可使你具备该领域的研究水平——但现在,这样的日子已经过去了。《数据挖掘原理(第4版)》的重点是介绍基本技术,而不是展示当今最新的数据挖掘技术,因为大多数情况下,当拿到一本书时,书中介绍的技术可能已被其他更新的技术取代了...

暂无课件

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
目    录

 

第1章  数据挖掘简介   1

1.1  数据爆炸   1

1.2  知识发现   2

1.3  数据挖掘的应用   3

1.4  标签数据和无标签数据   4

1.5  监督学习:分类   4

1.6  监督学习:数值预测   6

1.7  无监督学习:关联规则   6

1.8  无监督学习:聚类   7

第2章  用于挖掘的数据   9

2.1  标准制定   9

2.2  变量的类型   10

2.3  数据准备   11

2.4  缺失值   13

2.4.1  丢弃实例   14

2.4.2  用最频繁值/平均值替换   14

2.5  减少属性个数   14

2.6  数据集的UCI存储库   15

2.7  本章小结   16

2.8  自我评估练习   16

第3章  分类简介:朴素贝叶斯和最近邻算法   17

3.1  什么是分类   17

3.2  朴素贝叶斯分类器   18

3.3  最近邻分类   24

3.3.1  距离测量   26

3.3.2  标准化   28

3.3.3  处理分类属性   29

3.4  急切式和懒惰式学习   30

3.5  本章小结   30

3.6  自我评估练习   30

第4章  使用决策树进行分类   33

4.1  决策规则和决策树   33

4.1.1  决策树:高尔夫示例   33

4.1.2  术语   35

4.1.3  degrees数据集   35

4.2  TDIDT算法   38

4.3  推理的类型...

《数据挖掘原理(第4版)》的重点是介绍基本技术,而不是展示当今**的数据挖掘技术。一旦掌握了基本技术,就可通过多种渠道了解该领域的**进展。本书共23章,分别介绍了概述、用于挖掘的数据、朴素贝叶斯和最近邻算法、使用决策树进行分类、决策树归纳、估计分类器的预测精度、连续属性、避免决策树的过度拟合、关于熵的更多信息、归纳分类的模块化规则、度量分类器的性能、处理大量数据、集成分类、比较分类器、关联规则挖掘、聚类、文本挖掘、分类流数据、神经网络。
《数据挖掘原理(第4版)》涉及大量数据集、属性和值,也涉及不少数学公式,字母繁多,格式复杂。为便于检查对所学知识的掌握情况,每章都包含自我评估练习。所以本书末尾还有5个附录,分别介绍了基本数学知识、数据集、更多信息来源、词汇表和符号、自我评估练习题答案。
《数据挖掘原理(第4版)》面向计算机科学、商业研究、市场营销、人工智能、生物信息学和法医学专业的学生,可用作本科生或硕士研究生的入门教材。同时,对于那些希望进-一步提高自身能力的技术或管理人员来说,本书也是**的自学书籍。