





定价:79.8元
印次:1-6
ISBN:9787302307143
出版日期:2013.01.01
印刷日期:2020.08.27
图书责编:王军
图书分类:零售
随着数据集规模和复杂度的持续上升,分析员必须利用更高级的软件工具来执行间接的、自动的智能化 数据分析。《数据挖掘:概念、模型、方法和算法(第2版)》介绍了通过分析高维数据空间中的海量原始数据 来提取用于决策的新信息的尖端技术和方法。 本书开篇阐述数据挖掘原理,此后在示例的引导下详细讲解起源于统计学、机器学习、神经网络、模糊 逻辑和演化计算等学科的具有代表性的、最前沿的挖掘方法和算法。本书还着重描述如何恰当地选择方法和 数据分析软件并合理地调整参数。每章末尾附有复习题。 本书主要用作计算机科学、计算机工程和计算机信息系统专业的研究生数据挖掘教材,高年级本科生或 具备同等教育背景的读者也完全可以理解本书的所有主题。
Mehmed Kantardzic博士,是美国路易斯维尔大学的Speed工程学院的计算机工程与计算机科学系(CECS)的教授,担任CECS系的研究生主任,以及数据挖掘实验室主任。Kantardzic博士是IEEE(Institute of Electrical and Electronics Engineers)、ISCA(International Symposium on Computer Architecture),和SPIE(Society of Photo-Optical Instrumentation Engineers )的会员,他有多篇论文获奖,并已在许多相关的期刊上出版。他是各种会议的邀请嘉宾,也是许多书籍的贡献者。
前言 从本书第1版出版以来的7年中,数据挖掘领域在开发新技术和拓展其应用范围方面有了长足的进步。正是数据挖掘领域中的这些变化,令笔者下定决心修订本书的第1版,出版第2版。本版的核心内容并没有改变,但汇总了这个快速变化的领域中的最新进展,呈现了数据挖掘在学术研究和商业应用领域的最尖端技术。与第1版相比,最显著的变化是添加了如下内容: 一些新主题,例如集成学习、图表挖掘、时态、空间、分布式和隐私保护等的数据挖掘; 一些新算法,例如分类递归树(CART),DBSCAN (Density-Based Spatial Clustering of Applications with Noise)、BIRCH(Balanced and Iterative Reducing and Clustering Using Hierarchies)、PageRank、AdaBoost、支持向量机(SVM)、Kohonen自组织映射(SOM)和潜在语义索引(LSI); 详细介绍数据挖掘过程的实用方面和商用理解,讨论验证、部署、数据理解、因果关系、安全和隐私等重要问题; 比较数据挖掘模型的一些量化方式方法,例如ROC曲线、增益图、ROI图、McNemar测试和K折交叉验证成对t测试。 这是一本教材,所以还增加了一些新习题。这一版也更新了附录中的内容,包含了最近几年的新成果,还反映了某个新主题得到人们的重视时发生的变化。 笔者感谢在课堂上使用本书第1版的所有同行,以及支持我、鼓励我和提出建议的所有人,并在新版中采纳了这些建议。笔者真诚地感谢数据挖掘实验室和计算机科学系中的所有同事和...
1.1 概述 1
1.2 数据挖掘的起源 3
1.3 数据挖掘过程 4
1.4 大型数据集 7
1.5 数据仓库 10
1.6 数据挖掘的商业方面:为什么数据挖掘项目会失败 13
1.7 本书结构安排 15
1.8 复习题 16
1.9 参考书目 17
第2章 数据准备 19
2.1 原始数据的表述 19
2.2 原始数据的特性 23
2.3 原始数据的转换 24
2.3.1 标准化 24
2.3.2 数据平整 25
2.3.3 差值和比率 25
2.4 丢失数据 26
2.5 时间相关数据 27
2.6 异常点分析 30
2.7 复习题 35
2.8 参考书目 38
第3章 数据归约 41
3.1 大型数据集的维度 41
3.2 特征归约 43
3.2.1 特征选择 44
3.2.2 特征提取 48
3.3 Relief算法 50
3.4 特征排列的熵度量 51
3.5 主成分分析 53
3.6 值归约 55
3.7 特征离散化:ChiMerge技术 58
3.8 案例归约 61
3.9 复习题 63
3.10 参考书目 64
第4章 从数据中学习 67
4.1 学习机器 68
4.2 统计学习原理 72
4.3 学习方法的类型 75
4.4 常见的学习任务 77
4.5 支持向量机 80
4.6 kNN:最近邻分类器 90
4.7 模型选择与泛化 92
4.... 查看详情
同系列产品
查看详情-
在线凸优化(第2版)
[美] 埃拉德·哈赞(Elad Hazan)著 罗俊仁 张万鹏 译
ISBN:9787302661122
定 价:99.8元
-
Python应用数值方法——解决工程和科学问题
[美]史蒂文·C.查布拉(Steven C. Chapra),[法]戴维·E.克卢(David E. Clough)著 张建廷 王一 吕亚飞 侯文君 译
ISBN:9787302645153
定 价:158元
-
图数据挖掘:算法、安全与应用
宣琦、阮中远、闵勇 著
ISBN:9787302637141
定 价:98元
-
机器学习和深度学习:原理、算法、实战(使用Python 和 TensorFlow)
[印] 文卡塔·雷迪·科纳萨尼(Venkata Reddy Konasani)、沙伦德拉·卡德雷(Shailendra Kadre)著 秦婧 韩雨童 译
ISBN:9787302624790
定 价:128元