





作者:许可乐
定价:99元
印次:1-1
ISBN:9787302658467
出版日期:2024.05.01
印刷日期:2024.04.26
图书责编:王秋阳
图书分类:零售
本书围绕数据挖掘竞赛,讲解了各种类型数据挖掘竞赛的解题思路、方法和技巧,并辅以对应的实战案例。全书共11章。第1章介绍数据挖掘竞赛的背景、意义和现状。从第2章开始,介绍了各种不同类型的数据挖掘竞赛包括结构化数据、自然语言处理、计算机视觉(图像)、计算机视觉(视频)、强化学习。每种类型的数据挖掘竞赛包含理论篇和实战篇:理论篇介绍通用的解题流程和关键技术;实战篇选取比较有代表性的赛题,对赛题的优秀方案进行深入分析,并提供方案对应的实现代码。 本书适合数据挖掘竞赛爱好者、人工智能相关专业在校大学生、人工智能方向从业人员及对人工智能感兴趣的读者阅读。
"许可乐毕业于法国巴黎六大,目前任教于国防科技大学计算机学院,入选湖湘青年英才人才计划,Kaggle Grandmaster。长期从事智能模型开发与迭代研究。主持或参与自然科学基金、重点研发、国防科技创新特区等相关项目十余项,获军队科技进步奖一项,担任某重大工程项目副总设计师。在面向复杂开放环境的智能模型算法、支持OODA决策的深度强化学习方法等领域取得一系列原创性的成果,所提出算法在包括ACM KDD Cup 等国际人工智能和数据挖掘竞赛中获奖40余项,部分已经国防关键领域得到实践检验。在相关智能领域的公认的会议和期刊发表论文80余篇,相关论文被引用1700余次。现任中国自动化学会混合智能专委会委员、中国计算机学会语音对话与听觉专委会执行委员,欧盟/英国科研基金评审专家,担任AAAI等10余个国际**会议程序委员,担任20余个国际期刊审稿人,获CCF BDCI优秀指导老师奖。"
前 言 本书目标 本书旨在给读者提供明确的数据挖掘竞赛方案实现流程,并对其中的关键细节进行讲解,除了提供必要的理论知识,还提供了即插即用的代码。通过阅读此书,读者将了解如何为一个数据挖掘竞赛设计方案,明确方案中的各种细节和具体实现方式,并了解如何对方案进行不断打磨和优化。本书还提供了一些具体的实战案例以帮助读者掌握并强化上述内容。数据挖掘竞赛提供了贴近真实场景的数据集,如果想通过实战的方式来学习数据挖掘的技术,本书是一个很好的选择。 同时本书也可以作为一本工具书,它提供了不同类型(包括结构化数据、自然语言处理、计算机视觉、视频理解、强化学习)场景下,从数据输入到获取最终结果全流程中的各种方法和技巧,这些实用方法和技巧能帮助读者在数据集方面获得显著的效果提升,它们不仅可以用在数据挖掘竞赛中,也可以用于科研以及实际的业务中。 读者对象 无论是想在数据挖掘竞赛中获得更好的成绩,还是提升数据挖掘的技能,抑或是希望在实际业务中提升模型效果,本书都将是一个很好的选择。本书适用的读者对象包括但不限于以下相关人员。 ? 数据挖掘竞赛爱好者。 ? 人工智能相关专业在校大学生。 ? 人工智能方向从业人员。 ? 对人工智能感兴趣的读者。 需要注意的是,由于篇幅限制,本书不会从零开始讲解数据挖掘中的知识点,尽管笔者尽可能地以由浅入深的方式讲述全书的内容,但是理想情况下,本书的预期读者应具备一定的机器学习、深度学习以及强化学习的基础,同时还应具备一定的Python使用经验。 如果读者对以下的内容有所了解,就表示大致具备了相应的基础。 ? 机器学习:能区分有监督学习和无监督学...
第1章 数据挖掘竞赛介绍 1
1.1 数据挖掘竞赛的发展 1
1.2 数据挖掘竞赛的意义 4
1.3 竞赛平台介绍 5
1.4 各种竞赛的特点 8
1.5 竞赛常用工具 9
第2章 结构化数据:理论篇 13
2.1 探索性数据分析 13
2.2 数据预处理 18
2.2.1 缺失值 18
2.2.2 异常值 20
2.2.3 内存优化 21
2.3 特征构造 23
2.3.1 时间特征 23
2.3.2 单变量特征 25
2.3.3 组合特征 27
2.3.4 降维/聚类特征 28
2.3.5 目标值相关特征 30
2.3.6 拼表特征 33
2.3.7 时序特征 39
2.4 特征筛选 41
2.4.1 冗余特征过滤 41
2.4.2 无效/低效特征过滤 42
2.4.3 过拟合特征过滤 45
2.5 模型 49
2.5.1 结构化数据常用模型 49
2.5.2 模型超参数优化 55
2.5.3 线下验证 58
2.6 集成学习 62
2.6.1 投票法 62
2.6.2 平均法 63
2.6.3 加权平均法 64
2.6.4 Stacking 66
2.6.5 Blending 67
第3章 结构化数据:实战篇 70
3.1 赛题概览 70
3.2 数据探索 71
3.2.1 标签分布 71
3.2.2 缺失值 72
3.2.3 异常值 73
3.2.4 相关性 73
3.3 优秀方案解读 ... 查看详情