





定价:119元
印次:1-3
ISBN:9787302684893
出版日期:2025.03.01
印刷日期:2025.04.28
图书责编:夏毓彦
图书分类:零售
"《DeepSeek大模型高性能核心技术与多模态融合开发》深入剖析国产之光DeepSeek多模态大模型的核心技术,从高性能注意力机制切入,深入揭示DeepSeek的技术精髓与独特优势,详细阐述其在人工智能领域成功的技术秘诀。《DeepSeek大模型高性能核心技术与多模态融合开发》循序渐进地讲解深度学习注意力机制的演进,从经典的多头注意力(MHA)逐步深入DeepSeek的核心技术—多头潜在注意力(MLA)与混合专家模型(MoE)。此外,《DeepSeek大模型高性能核心技术与多模态融合开发》还将详细探讨DeepSeek中的多模态融合策略、技术及应用实例,为读者提供全面的理论指导与应用实践。《DeepSeek大模型高性能核心技术与多模态融合开发》配套所有示例源码、PPT课件、配图PDF文件与读者微信技术交流群。 《DeepSeek大模型高性能核心技术与多模态融合开发》共分15章,内容涵盖高性能注意力与多模态融合概述、PyTorch深度学习环境搭建、DeepSeek注意力机制详解(包括基础篇、进阶篇、高级篇及调优篇)、在线与本地部署的DeepSeek实战(如旅游特种兵迪士尼大作战、广告文案撰写与微调、智能客服等),以及多模态融合技术与实战应用(如Diffusion可控图像生成、多模态图文理解与问答、交叉注意力语音转换、端到端视频分类等)。 《DeepSeek大模型高性能核心技术与多模态融合开发》既适合DeepSeek核心技术初学者、注意力机制初学者、大模型应用开发人员、多模态融合开发人员、大模型研究人员,也适合高等院校及高职高专院校人工智能大模型方向的师生。"
王晓华,高校计算机专业讲师,研究方向为云计算、大数据与人工智能。其著作包括《深入探索Mamba模型架构与应用》《PyTorch深度学习与计算机视觉实践》《PyTorch语音识别实战》《ChatGLM3大模型本地化部署、应用开发与微调》《从零开始大模型开发与微调:基于PyTorch与ChatGLM》《PyTorch 2.0深度学习从零开始学》《Spark 3.0大数据分析与挖掘:基于机器学习》《TensorFlow深度学习应用实践》《OpenCV+TensorFlow深度学习与计算机视觉实战》《TensorFlow语音识别实战》《TensorFlow 2.0卷积神经网络实战》《深度学习的数学原理与实现》。
前 言 多模态大模型DeepSeek以其卓越的技术与出色的性能,在人工智能领域熠熠生辉,成为一颗璀璨的明珠。其成功的秘诀在于对注意力机制的突破性创新与MoE创新架构的巧妙运用,为人工智能领域带来了前所未有的变革。 DeepSeek不仅在理论上取得了显著突破,更在实际应用中展现出其强大的能力。通过高效融合多种模态的数据,DeepSeek在图像识别、自然语言处理、语音识别等领域均取得了令人瞩目的成果,为人工智能的多元化应用提供了强大的支持。 在此背景下,本书深入剖析注意力机制与多模态融合的基本原理,全面展示它们的技术概况,并结合丰富的应用案例,展望这两大技术的未来发展趋势。通过搭建PyTorch深度学习环境,读者可以亲自动手实践书中的丰富案例,从而在实践中更深入地理解这两大技术的精髓,并提高大模型应用开发能力。 本书不仅适合深度学习初学者、工程师、研究者、学校的师生阅读,也适合想要掌握最新注意力机制与多模态融合技术的高等院校师生阅读。 本书配套资源 本书配套实例源码、PPT课件、配图PDF文件与读者微信技术交流群,读者使用微信扫描下面的二维码即可获取。如果在阅读过程中发现问题或有任何建议,请联系下载资源中提供的相关电子邮箱或微信。 本书目的 当前,高性能大模型DeepSeek备受瞩目,而其背后的注意力机制与多模态融合技术更是成为深度学习研究领域的热点。本书致力于成为读者全面掌握DeepSeek核心技术的宝典,通过深入浅出的原理讲解与实例分析,引导读者系统学习DeepSeek的核心原理、架构及应用开发方法。 本书深入剖析了DeepSeek的核心技术——多头...
第1章 高性能注意力与多模态融合 1
1.1 从涌现到飞跃:高性能大模型的崛起 1
1.1.1 大模型的“涌现” 2
1.1.2 大模型的发展历程 3
1.1.3 高性能大模型的崛起 4
1.2 大模型的内功:高性能注意力机制的崛起 5
1.2.1 注意力机制的基本原理 5
1.2.2 注意力机制的变革与发展 6
1.2.3 高性能注意力机制崛起:GQA与MLA 6
1.3 大模型的外拓:多模态融合 7
1.3.1 多模态外拓及其挑战 7
1.3.2 融合策略与技术概览 7
1.3.3 深度学习在多模态融合中的应用场景 9
1.4 高性能注意力与多模态融合的未来展望 10
1.4.1 融合技术的创新方向 11
1.4.2 注意力机制的前沿探索 11
1.5 本章小结 12
第2章 PyTorch深度学习环境搭建 13
2.1 安装Python开发环境 13
2.1.1 Miniconda的下载与安装 13
2.1.2 PyCharm的下载与安装 16
2.1.3 计算softmax函数练习 20
2.2 安装PyTorch 2.0 21
2.2.1 NVIDIA 10/20/30/40系列显卡选择的GPU版本 21
2.2.2 PyTorch 2.0 GPU NVIDIA运行库的安装 21
2.2.3 Hello PyTorch 24
2.3 多模态大模型DeepSeek初探与使用 24
2.3.1 DeepSeek模型简介 25
2.3.2 D...
(2)《DeepSeek大模型高性能核心技术与多模态融合开发》致力于成为读者全面掌握DeepSeek核心技术的宝典,通过深入浅出的原理讲解与实例分析,引导读者系统学习DeepSeek的核心原理、架构及应用开发方法。
(3)《DeepSeek大模型高性能核心技术与多模态融合开发》深入剖析DeepSeek的核心技术多头潜在注意力MLA与混合专家模型MoE,详细阐述它们的工作原理与技术优势。
(4)《DeepSeek大模型高性能核心技术与多模态融合开发》详细探讨DeepSeek中的多模态融合方法,结合丰富的应用实例,为读者提供全面的理论与实践指导,助力读者深入理解高性能大模型的运行机制。
(5)实战项目涵盖情感分类、图像识别、语音识别、文本生成、图像生成、图文问答、视频分类、智能客服等应用场景。
(6)配套示例源码、数据文件、PPT课件、配图PDF文件与读者微信交流群。"