


作者:[英] 瓦伊巴夫·韦尔丹(Vaibhav Verdhan) 著 殷海英 译
定价:98元
印次:1-1
ISBN:9787302716396
出版日期:2026.06.01
印刷日期:2026.05.14
图书责编:王军
图书分类:零售
"生成式AI、预测算法、欺诈检测以及许多其他分析任务依赖于廉价且丰富的无标签数据。无标签数据上的机器学习——即无监督学习——将原始文本、图像和数字转化为关于客户的洞察、准确的计算机视觉以及用于训练人工智能模型的高质量数据集。本书将展示如何实现这一切。 《无标签数据处理:关键算法与模型实现》聚焦于无监督学习的数学基础、算法以及实际应用。书中通过详细注释的Python代码,提供了来自零售、航空和银行领域的实际案例。你将探索聚类和降维等核心技术,以及自编码器和生成对抗网络(GAN)等高级话题。在学习过程中,你将了解如何将无监督学习应用于商业领域,并发现如何从零开始开发完整的机器学习模型。 本书主要内容 ?掌握无监督学习算法 ?实际商业应用 ?构建AI训练数据集 ?探索自编码器和生成对抗网络(GAN)的应用"
"瓦伊巴夫???韦尔丹是一位经验丰富的数据科学专家,在一家大型制药公司从事数据科学项目工作。本书的技术编辑是达维德???德尔???文托。"
关于本书的赞誉 “学习无监督学习和生成式人工智能(GenAI)的必读之作。” —Khuram Pervez,EGA “无论是初学者还是从业者,本书都是一本实用的指南。” —Amaresh Rajasekharan,IBM “本书是解答关于无标签数据所有重要问题的终极资源。” —Arne Peter Raulf,德国航空航天中心 “一本全面且详细的指南,帮助你掌握无监督学习和生成式人工智能。” —Krishna Chaitanya Anipindi,Hexagon “简明扼要的指南,既涵盖理论,又注重实践。” —Deepika Sinha,AI/ML/GenAI的主管 献给Yashi、Pakhi、Rudra和Shiva 序 言 在今天快速发展的人工智能和机器学习领域,从无标签数据中提取有价值的洞察力正在改变各个行业,并推动着创新。作为一名人工智能领域的从业者,我在多个行业积累了丰富经验,目前正执掌某大型制药公司的数据科学与人工智能团队。我亲眼见证了许多创新思维如何彻底改变行业格局。 在肿瘤学和生物制药领域,我们利用人工智能帮助生命科学公司精准地向医疗专业人士提供支持,并且精确地锁定关键利益相关者——确保正确的治疗方法能在正确的时机送到合适的患者手中。在这些对精准性和合规性要求非常高的行业中,能够从原始的无标签数据中提取出实际可用的洞察力,已不再是可有可无,而是至关重要的。 《无标签数据处理:关键算法与模型实现》分为三个部分,系统地介绍了从理论到实践的完整...
第Ⅰ部分 基础
第1章 机器学习简介 3
1.1 技术工具包 4
1.2 数据、数据类型、数据管理与质量 4
1.2.1 什么是数据 4
1.2.2 各种类型的数据 5
1.2.3 数据质量 8
1.2.4 数据工程与管理 10
1.3 数据分析、机器学习(ML)、人工智能(AI)和商业智能(BI) 11
1.4 机器学习的基本原理 12
1.5 机器学习算法的类型 15
1.5.1 监督学习 15
1.5.2 无监督算法 20
1.5.3 半监督算法 24
1.5.4 强化学习 24
1.6 结语 25
1.7 本章小结 26
第2章 聚类技术 27
2.1 技术工具包 28
2.2 聚类 28
2.3 基于质心的聚类 31
2.3.1 k-means聚类 33
2.3.2 聚类准确性衡量 35
2.3.3 寻找k的最优值 36
2.3.4 k-means聚类的优缺点 37
2.3.5 使用Python实现k-means聚类 38
2.4 基于连接性的聚类 42
2.4.1 层次聚类的类型 44
2.4.2 距离度量的连接准则 45
2.4.3 最优聚类数 46
2.4.4 层次聚类的优缺点 47
2.4.5 使用Python进行层次聚类案例研究 48
2.5 基于密度的聚类 51
2.5.1 邻域与密度 51
2.5.2 DBSCAN 52
2.6 使用聚类的案例研究 57
2.6.1 业务背景 58
2.6.2 ... 查看详情
《无标签数据处理:关键算法与模型实现》分为三个部分,系统地介绍了从理论到实践的完整过程,内容详见目录。第Ⅰ部分为读者奠定了基础,讲解了无监督学习的核心技术,包括聚类、降维和异常检测,让读者掌握解读原始数据的基本技能。第Ⅱ部分深入探讨了更复杂的技术,介绍了自监督学习和对比学习方法,这些方法能够突破标签数据稀缺带来的限制。第Ⅲ部分则将理论与实践相结合,讲解深度学习的基本内容——包括神经网络构建模块、激活函数、自编码器,并提供了具体的TensorFlow和Keras代码实现,还介绍了生成对抗网络(GAN)、BERT和像GPT这样的超大语言模型等先进的生成模型。最后,附录A还展示了如何将这些工具应用到实际的挑战中,帮助从业者利用人工智能制定出符合合规要求的上佳策略,取得理想的效果。

