数据挖掘概念、模型、方法和算法(第3版)
介绍了在高维数据空间中从大量数据中分析和提取信息的新技术,随书赠送参考书目和参考文献,获取地址见书封底二维码。教材服务QQ:1815317009。

作者:[美]哈默德·坎塔尔季奇(Mehmed Kantardzic)著 李晓峰 刘刚 译

丛书名:计算机与智能科学丛书

定价:128元

印次:1-1

ISBN:9787302577423

出版日期:2021.06.01

印刷日期:2021.06.03

图书责编:王军

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

第3版介绍并扩展了许多主题,提供了软件工具和数据挖掘应用程序的修订部分;还更新了参考书目列表,供感兴趣的读者进一步研究;扩展了涉及每个章节的问题列表。展示了如下新信息: 探索大数据和云计算 论述深度学习 包括卷积神经网络(CNN)的信息提出了强化学习 包含半监督学习和S3VM回顾不平衡数据的模型评估

Mehmed Kantardzic博士,1980年获得计算机科学博士学位,2004年起在路易斯维尔大学担任教授。现任CSE(计算机科学与工程)副主席,数据挖掘实验室主任,CSE研究生部主任。他的研究重点是数据挖掘和知识发现、机器学习、软计算、点击欺诈检测和预防、流数据中的概念漂移以及医疗数据挖掘。Kantardzic博士的荣誉很多,研究论文获得了许多杰出和荣誉提名奖,教学方面则曾荣获最喜爱的教师和杰出教学奖。他曾任职于多家国际期刊的编辑委员会,是美国国家科学基金会(NSF)等多个国家科学基金会的审核员和小组成员,担任IEEEICMLA 2018等多个国际会议的总主席或项目主席。

前 言                  自2011年本书第2版出版以来,数据挖掘领域取得了很大的进展。大数据(Big Data)这个术语被引入并被广泛接受,用来描述收集、分析和使用大量不同数据的数量和速度。建立新的数据科学领域,可以描述先进工具和方法的所有多学科方面,可以从大数据中提取有用的和可操作的信息。本书的第3版总结了快速变化的数据挖掘领域的这些新发展,并介绍了在学术环境和高级应用程序部署中系统方法所需的最新数据挖掘原则。   虽然第3版对核心内容保持不变,但本版中最重要的变化和补充突出了该领域的动态,其中包括: ● 大数据、数据科学、深度学习等新课题; ● 新方法包括强化学习、云计算和MapReduce框架; ● 对不平衡数据、数据挖掘模型的公平性和聚类验证的主观性进行了新的强调; ● 附加的高级算法,如卷积神经网络(Convolutional Neural Networks,CNN),半虚拟支持向量机(Semisupervised Support Vector Machines,S3VM),Q学习,随机森林,非平衡数据建模的SMOTE算法; ● 每个章节都增加了额外的示例和练习,以及参考书目、供进一步阅读的参考资料,另外还更新了附录。   我要感谢路易斯维尔大学计算机工程与计算机科学系数据挖掘实验室的在校生和往届学生,感谢他们为第3版的编写所做的贡献。Tegjyot Singh Sethi和Elaheh Arabmakki根据他们的助教经验,为数据挖掘课程提供了以前版本的教材,并提供了评论和建议。Lingyu Lyu 和Mehmet ...

暂无课件

暂无样章

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
第1章  数据挖掘的概念 1

1.1  概述 1

1.2  数据挖掘的起源 3

1.3  数据挖掘过程 5

1.4  从数据收集到数据预处理 8

1.5  用于数据挖掘的数据仓库 11

1.6  从大数据到数据科学 14

1.7  数据挖掘的商业方面:为什

么数据挖掘项目会失败 17

1.8  本书结构安排 20

1.9  复习题 22

第2章  数据准备 25

2.1  原始数据的表述 25

2.2  原始数据的特性 29

2.3  原始数据的转换 30

2.3.1  标准化 30

2.3.2  数据平整 31

2.3.3  差值和比率 32

2.4  丢失数据 32

2.5  时间相关数据 34

2.6  异常点分析 37

2.7  复习题 43

第3章  数据归约 47

3.1  大型数据集的维度 47

3.2  特征归约 49

3.2.1  特征选择 51

3.2.2  特征提取 55

3.3  Relief算法 57

3.4  特征排列的熵度量 59

3.5  主成分分析 61

3.6  值归约 63

3.7  特征离散化:ChiMerge

技术 66

3.8  案例归约 69

3.9  复习题 71

第4章  从数据中学习 75

4.1  学习机器 76

4.2  统计学习原理 80

4.3  学习方法的类型 84

4.4  常见的学习任务 86

4.5  支持向量机 89

4.6  半监督支持向量机

(S3VM) 100

4.7  k最近邻分类器 103

4.8  模型选择与泛...

《数据挖掘概念、模型、方法和算法(第3版)》已被全球100多所大学的“数据挖掘”课程所选用,有汉语、日语、西班牙语和波斯语等多个译本。
本书介绍了在高维数据空间中从大量数据中分析和提取信息的新技术,在前几版的基础上进行了大量的修订和更新,介绍了分析大数据集的一个系统方法。该方法集成了统计、人工智能、数据库、模式识别和计算机可视化等学科的结果。另外,深度学习技术的进步开辟了一个全新的应用领域。本书作者是该领域的著名专家,他在书中详细解释了近年来发展起来的基本概念、模型和方法。