行业名家力荐
人工智能的发展浩荡前行,累计出现过三次大的浪潮。第一次浪潮的符号主义困于逻辑的桎梏,第二次浪潮的连接主义受限于数据的藩篱,而作为第三次浪潮的深度学习技术则散发出魅力,为学术和产业界追捧,并持续酝酿、发酵及推动更猛烈的智能革命,被人们誉为第四次浪潮的大语言模型也正是基于深度学习。
由Simon J. D. Prince所著并由张亚东、马壮翻译的《理解深度学习》一书,从基础概念到核心技术再到最新进展,以全局视角系统性地梳理了深度学习的技术及应用发展全景,同时匹配了代码资源,是学术界和工业界有志于从事深度学习技术研究的新人上手实践不可多得的案头读物。
全书围绕深度神经网络的设计与应用展开,开篇聚焦网络训练策略以及性能评估,以奠定相关基础;继而深入解析卷积神经网络、残差连接与Transformer等关键架构的创新原理及其在各类任务中的适用性;随后剖析生成式对抗网络、变分自编码器、标准化流与扩散模型等现代生成机制,并概述深度强化学习的核心思想;结尾则从理论层面探讨深度网络的可训练性、泛化能力与参数冗余等基础问题,并从伦理角度反思深度学习技术的社会影响,内容上兼具理论深度与实践广度。
Simon教授因其具有工业界和学术界的双重经历,或许更了解那些苦于既不掌握技术细节,又难以动手实践的读者的困扰,因此本书写作风格深入浅出,配有大量的图与表以清楚地解释原本晦涩的概念,偶尔出现的公式看似枯燥,实际是有高等数学和线性代数基础读者可以轻松掌握的,也绝对是理论的有力补充。
深度学习技术及其应用已深入我们的工作与生活,如果你希望能够在这样一个智能革命的时代做一个弄潮儿,从这本书开始是个不错的选择。
李鑫
科大讯飞AI研究院副院长,科研部部长
在AI技术飞速演进的今天,我们正迎来“从模型走向应用”的时代。无论是产业数字化升级,还是开发者的新一轮创业浪潮,人工智能的落地能力,正在成为一家公司能否穿越周期的关键变量。极客邦科技在 2025 年将“AI 应用落地”定为年度主题,正是基于这样的判断:时代的新窗口已经打开,技术理解力决定了实践行动力。
在这个背景下,我非常高兴看到Simon J.D. Prince的经典著作Understanding Deep Learning推出中文版《理解深度学习》。这本书并不只是一本理论教材,它是一部帮助读者“真正理解”深度学习的入门指南。在我们长期运营InfoQ极客传媒、极客时间和TGO鲲鹏会的过程中,经常听到工程师、架构师和CTO们吐槽:“讲 Transformer 的人太多,能讲明白的人太少;讲推理框架的人不少,但从头带你理解原理的人几乎没有。”而这本书,恰恰解决了这样的问题。
《理解深度学习》不是快餐式教学,而是一场系统思维的启蒙。它通过严谨而通俗的语言,从线性代数、概率基础一步步引导你走进深度神经网络的世界。与市面上许多“照公式堆概念”的 AI 教程不同,本书强调WHY胜于WHAT,强调“理解”胜于“记忆”。它告诉我们,只有真正明白深度学习是如何工作的,才可能在未来的工程场景中创造出具有价值的应用。
对我个人而言,本书的意义不仅在于技术层面,更在于方法论上的启发。它体现了极客邦科技在内容和教育产品设计中始终坚持的价值观:技术的传播,应该是“实践驱动”的,应该追求可理解、可推理、可迁移,而不仅仅是堆叠信息。
随着AIGC、Agent、Agentic AI等技术生态加速演进,我们越来越看到,未来的开发者既要“理解底层”,又要“善用高阶工具”;既要具备对模型机制的抽象理解,也要能把技术变成具体的生产力。这本书,是打好底层认知根基的首选。
最后,我想特别感谢清华大学出版社引进这本作品。在喧嚣的当下,需要有人静下心来,从底层逻辑入手,抽丝剥茧,为世人排除通往未来的道路上的重重障碍。所以说,《理解深度学习》不仅是一本技术书籍,更是一把钥匙,帮助我们打开AI世界的思维之门。我相信,对于每一个想在 AI 应用时代中抓住机会的读者来说,这都将是一次重要的认知启程。
霍太稳
极客邦科技创始人兼CEO
《理解深度学习》是一本来自MIT的重磅教材,结构清晰,内容全面覆盖人工智能领域从基础到前沿的各种关键主题。作者是一位在学术界和工业界都有贡献的计算机科学家。他以直观的方式讲解复杂概念,同时结合了数学推导和可视化图示,帮助读者实现理论与实践的对接。无论是初学者,还是希望系统梳理AI知识的从业者,都能从中受益。
李烨
微软AI亚太区首席应用科学家
由深度学习引领的人工智能技术正在为各行各业带来巨大的范式创新。《理解深度学习》一书以精炼的文笔对深度学习这一复杂的理论体系抽丝剥茧,简明不失深刻,前沿不失实用,是系统掌握深度学习的佳作。
李建忠
全球机器学习技术大会主席,CSDN高级副总裁
《理解深度学习》是一部极具时代价值的经典教材。与传统教材不同,Simon J.D. Prince教授巧妙地在理论深度与实用性之间找到了平衡点,既避免了纯理论的晦涩,又不陷入代码实现的琐碎细节。我尤其欣赏本书对Transformer和扩散模型等前沿架构的深入剖析,这正是当前大模型技术的核心基石。书中通过精心设计的图表和直观解释,将复杂概念化繁为简,让读者真正"理解"而非仅仅"使用"深度学习。张亚东、马壮两位专家的翻译精准流畅,既保留原著的学术精髓,又贴合中文表达,有专门的章节探讨AI伦理与社会责任。对想在飞速迭代的AI浪潮中抓住技术本质的中文读者,本书是首选的入门与进阶指南。
王昊奋
OpenKG轮值主席,同济大学特聘研究员
在人工智能重塑人类文明边界的今天,Simon教授的《理解深度学习》犹如一盏明灯,既照亮了技术进化的底层逻辑,又烛照了伦理思考的精神维度。这部权威著作完美平衡了学术深度与教学温度,堪称深度学习领域的"概念罗盘"。无论你是渴望夯实理论根基的开发者,还是探寻智能本质的思想者,都能在这部兼具学术严谨性与思维启发性的作品中获得双重提升。在这个算法重构世界的时代,本书不仅是通向技术内核的通行证,更是一份关于智能文明的责任宣言。正如作者的观点:"我们或许尚未真正理解深度学习,但绝不能停止理解它的努力。"这部著作,正是这场认知远征的最佳向导。
茹炳晟
腾讯Tech Lead,腾讯研究院特约研究员,
中国计算机学会CCF TF研发效能SIG主席
作为一名长期致力于集成电路领域教学与研究的教育工作者,我非常荣幸地向各位郑重推荐这本名为《理解深度学习》的优秀著作。
集成电路是现代科技的基石,尤其在人工智能时代,高性能、低功耗的芯片更是驱动AI技术发展的核心引擎。深度学习作为人工智能领域的核心技术之一,正以前所未有的速度渗透到集成电路的各个环节,从面向AI应用的芯片架构设计、智能化的设计、自动化工具开发,到利用AI进行电路性能优化和故障诊断,再到基于新型存储器实现高效的AI计算,都展现出巨大潜力。可以预见,未来的集成电路发展将更加紧密地契合AI领域的需求。
《理解深度学习》一书系统而深入地介绍了深度学习的基本原理和核心架构,如卷积神经网络、循环神经网络,以及近年来备受瞩目的生成式对抗网络、扩散模型和Transformer等。这些内容不仅能帮助集成电路领域的学生和研究人员快速掌握深度学习的关键技术,更能启发工程师们思考如何设计出更高效、更智能的芯片,以满足日益增长的AI算力需求,并探索将这些先进的算法直接部署到芯片上的可能性,实现软硬件的深度融合。
我相信,这本书的出版将成为连接集成电路领域与深度学习领域的桥梁,促进跨学科的交流与合作,加速人工智能技术在集成电路领域的创新应用,并推动设计出更智能、更强大的AI芯片。我诚挚地希望《理解深度学习》能够成为你探索人工智能奥秘、赋能集成电路事业的得力助手。
叶乐
北京大学集成电路学院/博雅教授
作为多年从事人工智能领域研究的教育工作者,我非常荣幸能为《理解深度学习》这本杰出的著作撰写推荐序。
作为人工智能领域的核心技术,深度学习(尤其是大语言模型)近年来取得了令人瞩目的成就,深刻地改变了我们的生活和工作方式。然而,深度学习的理论基础和内部机制相对复杂,对于初学者来说,往往存在一定的学习门槛。
《理解深度学习》这本书的出现,恰好弥补了这一缺憾。本书以清晰易懂的语言,深入浅出地介绍了深度学习(包括大语言模型)的基本概念、原理和方法。作者通过丰富的、深入浅出的讲解,让零基础的读者也能像搭积木一样,一步步掌握深度学习的核心魔法,并逐步掌握深度学习的核心技术。
本书的亮点总结如下。
系统全面的知识体系:本书涵盖深度学习的各个方面,从基础知识到各类模型应用方向,构建了一个完整的知识体系,帮助读者全面了解深度学习。
深入浅出的讲解方式:作者采用通俗易懂的语言,配合丰富的图表和公式,将复杂的概念和理论转化为易于理解的知识,降低了学习难度。
理论与实践相结合:本书不仅介绍了深度学习的理论知识,还提供了一定量的习题,帮助读者更好地掌握所学知识和理论。
本书的中文翻译版,更是为广大中文读者提供了一个便捷的学习途径。我相信,无论是初学者还是专业人士,都能从本书中获益匪浅。
我强烈推荐《理解深度学习》这本书,相信它将成为你学习深度学习的得力助手。
郭艳卿
大连理工大学未来技术学院/人工智能学院副院长
译者序
尊敬的读者:
首先,由衷地感谢你拿起我翻译的这本《理解深度学习》(Understanding Deep Learning)。作为本书的译者,能将这本杰作呈现在中文读者面前,我备感荣幸,内心充满感激之情。
我要向本书的作者西蒙·J. D.普林斯教授致以最诚挚的谢意。感谢他创作了这样一本深入浅出、系统全面、充满洞见的深度学习著作。本书不仅揭开了深度学习的神秘面纱,更以清晰的逻辑和丰富的实例,引导读者逐步理解和掌握这一前沿技术的核心概念和应用方法。 在翻译过程中,我一次次地被作者的深刻思考所折服,也愈发体会到这本书对于想要入门或深入理解深度学习、大模型学习的读者来说,是多么宝贵和不可或缺。
感谢编辑王军老师,一次偶遇让我有了圆梦的机会!深度学习(尤其是大语言模型)作为人工智能领域的核心驱动力,正深刻改变着世界。将这样一本优秀的著作译成中文,使其能够惠及广大的中文读者,帮助朋友们理解并掌握这方面的相关原理与技术,是我的荣幸。
翻译过程既是一次充满挑战的智力探险,也是一段收获满满的学习之旅。我力求在忠实原文的基础上,尽可能地使译文流畅自然,易于理解。确保术语的准确性和表达的规范性,尽量保证精准翻译每个细节。如果有任何不确切或者谬误之处,请原谅译者的才具不足。
在此,衷心感谢在本书翻译和出版过程中给予我帮助和支持的所有朋友们。感谢付裕从头到尾给予的指点与支持。感谢合作译者马壮的支持,他完成了另一半的翻译工作。感谢朋友王志晨校对了每一句中文,让工科背景人的译作也向“信、达、雅”靠近了!感谢所有为本书的出版辛勤付出的其他人士,使得本书的中文版能以高质量的面貌呈现在大家面前。
衷心希望本书能帮助更多读者踏入深度学习、大语言模型的大门,理解其精髓,掌握其应用,并在未来的学习和工作中取得更大成就。如果我能为中国的深度学习技术发展贡献绵薄之力,那将是我最大的荣幸。
愿你在AI技术这一激动人心的探索之旅中,收获满满!
译者 张亚东
无论是在求学阶段,还是在步入职场后,很多人都会向我提出这样一个问题:“我准备进入人工智能领域进行学习或研究,你能推荐一些合适的学习资料吗?”
在当今这个信息爆炸的时代,获取学习资料的渠道并不匮乏,各类书籍和视频资源可谓琳琅满目。但我始终没有找到一本合适的“人工智能入门指南”。一部分书籍罗列了许多新颖的算法,但缺乏深入剖析,浮于表面;它们更适合作为科普读物,对于希望深入学习的读者来说,内容深度是远远不够的。一部分书籍从最基础的数学原理入手,详细列出相关公式,但学习门槛较高;而且即便完全掌握了这些原理,若想将算法落地,仍需要补充对应的编程技能。还有一部分书籍侧重实践应用,提供了大量示例代码和详细讲解,却容易让读者陷入“知其然”而“不知其所以然”的困境。
直到阅读了亚东老师推荐的Understanding Deep Learning后,我意识到终于找到理想的“指南书”了。本书从最基础的浅层神经网络入手,逐步深入,直至扩散模型,内容包罗万象。在基础模型章节中,Simon教授对每个问题的建模和公式推导都进行了细致入微的讲解;在高级模型章节中,阐述原理,还深入探讨模型的应用场景及前沿研究趋势。如果你潜心研读每一章节、每一个公式,会发现Simon教授倾注了大量心血,力求将复杂的概念以最清晰的方式呈现给读者。深度学习的难点之一在于如何理解高维空间中的问题,Simon教授通过降维和可视化手段,将梯度下降、迭代求解等抽象过程直观展现出来,极大地降低了理解门槛。本书讲解算法原理,还附有每个模型的Python Notebook源代码。无论你是具备一定数学基础的本科生,还是希望深入了解人工智能技术的软件工程师,本书都是你的最佳选择。
非常感谢亚东老师让我参与本书的翻译工作。翻译不仅是将文字从一种语言转换为另一种语言的过程,更是一次重构和深化知识体系的宝贵机会。在翻译过程中,原本零散的知识碎片被重新串联起来,形成更完整的知识框架,这对我来说是一次极为珍贵的经历。
由于时间仓促且本人学识有限,译文中难免存在疏漏与不足之处,恳请各位读者批评指正。同时,建议有能力的读者直接阅读Simon教授的原文,相信你一定会从中获得更多启发与收获。
译者 马壮
序言
这是一本最新的权威深度学习入门书籍,内容通俗易懂。本书涵盖从机器学习基础知识到高级模型的全部内容,精选了机器学习领域的核心要点和前沿课题,并直观地凝练了知识要点。
涵盖前沿课题,如 Transformer 和扩散模型。
用通俗易懂的语言阐述复杂的概念,并辅以数学公式和可视化图表。
使读者能够实现简单的模型。
提供了全面的在线资料,含 Python Notebook 中的编程练习。
适合任何具有应用数学基础的人学习。
Simon J. D. Prince 是巴斯大学计算机科学系荣誉教授,是《计算机视觉:模型、学习和推断》一书的作者。他是一位专注于人工智能和深度学习研究的科学家,曾在Borealis AI 等公司担任研究员。
这是一部学术与视觉双重精妙的杰作。它以简洁而清晰的方式传递核心思想,并通过精心设计的插图加以诠释,堪称当今最出色的深度学习入门著作。
——Kevin Murphy
Google DeepMind研究科学家
Probabilistic Machine learning: Advanced Topics作者
前言
在学术界,深度学习的发展史极不寻常。一小群科学家坚持不懈地在一个看似没有前途的领域工作了25年,最终使一个领域发生了技术革命并极大地影响了人类社会。研究者持续探究学术界或工程界中深奥且难以解决的问题,通常情况下这些问题无法得到根本性解决。但深度学习领域是个例外,尽管广泛的怀疑仍然存在,但Yoshua Bengio、Geoff Hinton 和Yann LeCun 等人的系统性努力最终取得了成效。
本书的书名是“理解深度学习”,这意味着它更关注深度学习背后的原理,而不侧重于编程实现或实际应用。本书的前半部分介绍深度学习模型并讨论了如何训练它们,评估它们的表现并做出改进。后半部分讨论专用于图像、文本、图数据的模型架构。只要学习过线性代数、微积分和概率论的二年级本科生都能掌握这些章节的知识。对于后续涉及生成模型和强化学习的章节,则需要更多的概率论和微积分知识,它们面向更高年级的学生。
这个书名在一定程度上也是一个玩笑——在撰写本书时,没有人能够真正理解深度学习。目前深度神经网络学习的分段线性函数的数量比宇宙中的原子数还多,可用远少于模型参数数量的样本进行训练。现在我们既无法找到可靠地拟合这些函数的方法,又不能保证能很好地描述新数据。第20章讨论了上述问题和其他尚未完全理解的问题。无论如何,深度学习都将或好或坏地改变这个世界。最后一章讨论了人工智能伦理,并呼吁从业者更多地考虑所从事的工作带来的伦理问题。
本书配套资源丰富,提供教师课件、习题及Python Notebook编程练习。
你的时间是宝贵的,为了保证你能高效理解深度学习相关知识,本书的内容都经过我的精心整理。每一章都对最基本思路进行简明描述,并附有插图。附录回顾了所有数学原理。对于希望深入研究的读者,可认真研究每章列出的问题、Python Notebook资源和背景说明。
致谢
本书的出版离不开以下人士的无私帮助和建议:Kathryn Hume、Kevin Murphy、Christopher Bishop、Peng Xu、Yann Dubois、Justin Domke、Chris Fletcher、Yanshuai Cao、Wendy Tay、Corey Toler-Franklin、Dmytro Mishkin、Guy McCusker、Daniel Worrall、Paul McIlroy、Roy Amoyal、Austin Anderson、Romero Barata de Morais、Gabriel Harrison、Peter Ball、Alf Muir、David Bryson、Vedika Parulkar、Patryk Lietzau、Jessica Nicholson、Alexa Huxley、Oisin Mac Aodha、Giuseppe Castiglione、Josh Akylbekov、Alex Gougoulaki、Joshua Omilabu、Alister Guenther、Joe Goodier、Logan Wade、Joshua Guenther、Kylan Tobin、Benedict Ellett、Jad Araj、Andrew Glennerster、Giorgos Sfikas、Diya Vibhakar、Sam Mansat-Bhattacharyya、Ben Ross、Ivor Simpson、Gaurang Aggarwal、Shakeel Sheikh、Jacob Horton、Felix Rammell、Sasha Luccioni、Akshil Patel、Mark Hudson、Alessandro Gentilini、Kevin Mercier、Krzysztof Lichocki、Chuck Krapf、Brian Ha、Chris Kang、Leonardo Viotti、Kai Li、Himan Abdollahpouri、Ari Pakman、Giuseppe Antonio Di Luna、Dan Oneată、Conrad Whiteley、Joseph Santarcangelo、Brad Shook、Gabriel Brostow、Lei He、Ali Satvaty、Romain Sabathé、Qiang Zhou、Prasanna Vigneswaran、Siqi Zheng、Stephan Grein、Jonas Klesen、Giovanni Stilo、Huang Bokai、Bernhard Pfahringer、Joseph Santarcangelo、Kevin McGuinness、Qiang Sun、Zakaria Lotfi、Yifei Lin、Sylvain Bouix、Alex Pitt、Stephane Chretien、Robin Liu、Bian Li、Adam Jones、Marcin Świerkot、Tommy Löfstedt、Eugen Hotaj、Fernando Flores Mangas、Tony Polichroniadis、Pietro Monticone、Rohan Deepak Ajwani、Menashe Yarden Einy、Robert Gevorgyan、Thilo Stadelmann、Gui JieMiao、Botao Zhu、Mohamed Elabbas、Satya Krishna Gorti、James Elder、Helio Perroni Filho、Xiaochao Qu、Jaekang Shin、Joshua Evans、Robert Dobson、Shibo Wang、Edoardo Zorzi、Joseph Santarcangelo、Stanisław Jastrzębski、Pieris Kalligeros、Matt Hewitt和Zvika Haramaty.
感谢 Daniyar Turmukhambetov、Amedeo Buonanno、Tyler Mills、Andrea Panizza和Bernhard Pfahringer 对多个章节给出的详细修改建议。尤其感谢Andrew Fitzgibbon和Konstantinos Derpanis 通读全书,你们的热情使我有动力完成本书的撰写工作。同时,感谢Neill Campbell和Özgür Şimşek邀请我到巴斯大学讲课,在那里我基于这些材料第一次开设了一门课程。最后,尤其感谢编辑 Elizabeth Swayze 提出的中肯建议。
第12章(变换器)和第17章(变分自编码器)最初发布在Borealis AI的博客中,改编后的版本在获得许可的情况下在此转载。非常感谢他们对我工作的支持。第16章(标准化流)大致基于Kobyzev等人在2002年发表的文章,我是该文章的合著者。我很幸运能够和来自达尔豪斯大学的Travis LaCroix合作撰写第21章。他既有趣又平易近人,他承担了大部分工作。