





定价:129元
印次:1-1
ISBN:9787302695356
出版日期:2025.06.01
印刷日期:2025.06.10
图书责编:夏毓彦
图书分类:零售
"《DeepSeek原生应用与智能体开发实践》围绕DeepSeek大模型应用开发展开,深度融合技术创新与工程实践,内容覆盖大模型应用开发(在线调用、提示词、推理、Agent、工具调用、MCP、微调、蒸馏、后训练、RAG)技术栈及其案例。书中原理与案例相融合,注重培养读者的大模型原生应用与智能体开发能力,并构建从理论到落地的完整知识体系。《DeepSeek原生应用与智能体开发实践》配套示例源码、PPT课件、配图PDF文件、读者微信交流群。 《DeepSeek原生应用与智能体开发实践》共分16章,内容包括大模型时代、DeepSeek开发环境配置与开放API使用、提示工程与DeepSeek提示库、思维链与DeepSeek推理模型、基于DeepSeek的Agent开发详解、DeepSeek的Function Calling与MCP应用实战、大模型驱动的即时金融信息采集与分析平台、KV Cache加持的推理加速、MLA注意力机制、MoE专家模型、MTP与多组件优化、大模型微调技术与应用、大模型蒸馏技术与应用、后训练算法GRPO详解与实战、基于后训练的智能医疗问诊实战,以及基于A2A、MCP与RAG的多Agent跨境电商智能客服实战。 《DeepSeek原生应用与智能体开发实践》既适合DeepSeek开发初学者、大模型原生应用与智能体开发人员、模型优化与工程化工程师、大模型研究人员、行业AI解决方案提供商,也适合高等院校及高职高专院校学习人工智能大模型的学生。"
王晓华,高校计算机专业讲师,研究方向为云计算、大数据与人工智能。其著作包括《DeepSeek大模型高性能核心技术与多模态融合开发》《深入探索Mamba模型架构与应用》《PyTorch深度学习与计算机视觉实践》《PyTorch语音识别实战》《ChatGLM3大模型本地化部署、应用开发与微调》《从零开始大模型开发与微调:基于PyTorch与ChatGLM》《PyTorch 2.0深度学习从零开始学》《TensorFlow深度学习应用实践》《OpenCV+TensorFlow深度学习与计算机视觉实战》《TensorFlow语音识别实战》《TensorFlow 2.0卷积神经网络实战》《深度学习的数学原理与实现》。
前 言 在人工智能技术爆炸式发展的当下,大语言模型(Large Language Model,LLM)已成为推动产业智能化转型的核心驱动力。随着DeepSeek-V3、DeepSeek-R1等突破性模型的发布,大模型在推理能力、训练效率和应用场景上实现了质的飞跃,但技术落地的复杂性也呈指数级增长。当前市场上虽不乏大模型理论教材,却鲜有系统性覆盖从开发环境搭建到行业垂直领域实战的完整指南,尤其在参数微调、推理加速、应用开发等核心技术环节存在实践断层。本书填补了这一空白,通过深度解构DeepSeek技术体系,为开发者构建从底层架构到上层应用的全链路能力。 本书注重工程与实践,融合了工业界实战经验与前沿研究成果。在内容组织上,既涵盖DeepSeek核心技术原理与代码实现,又通过即时金融信息采集与分析、智能医疗问诊、跨境电商智能客服等真实场景,展现大模型后训练算法GRPO、MCP协议及知识增强技术RAG的落地方法。相较于传统技术书籍,本书独创性地将理论推导、环境配置、模型优化与行业应用四大模块有机串联,形成“技术认知-工具使用-场景落地”的完整闭环,助力开发者快速跨越从技术理解到工程实现的鸿沟。 本书目的 本书旨在为大模型开发者、研究者及AI从业者提供一套系统化的大模型技术实践指南,聚焦DeepSeek大模型的技术讲解与行业落地。通过从基础环境搭建到高阶算法优化的全流程解析,帮助读者掌握大模型开发的核心方法论。同时,本书还通过多个应用实战案例,揭示大模型技术如何与具体业务需求深度融合,助力读者构建端到端的智能化解决方案,提升技术在产业中的实际应用价值。 本书另一核心目标...
第 1 章 大模型时代 1
1.1 大模型的诞生与发展 1
1.1.1 大语言模型发展简史与概念 2
1.1.2 大语言模型的生成策略 3
1.2 大语言模型发展的里程碑 4
1.2.1 注意力机制是大模型发展的里程碑 4
1.2.2 注意力机制的关键创新 5
1.2.3 注意力机制对语言建模的影响 7
1.2.4 大模型中的涌现与Scaling Law 10
1.2.5 大模型的训练方法SFT与RLHF 12
1.3 大语言模型发展的“DeepSeek时刻” 13
1.3.1 重塑世界AI格局的DeepSeek-V3 14
1.3.2 推理能力大飞跃的DeepSeek-R1 16
1.4 大模型的应用与展望 18
1.4.1 大模型的实际应用 18
1.4.2 大模型发展面临的展望 19
1.5 本章小结 20
第 2 章 DeepSeek开发环境配置与开放API使用 21
2.1 安装Python开发环境 21
2.1.1 Miniconda的下载与安装 21
2.1.2 PyCharm的下载与安装 24
2.2 安装DeepSeek开发框架 28
2.2.1 不同显卡与运行库的选择 28
2.2.2 PyTorch GPU版本的安装 28
2.2.3 测试PyTorch和CUDA安装信息 30
2.3 在线DeepSeek应用配置详解 31
2.3.1 DeepSeek简介与免费使用 32
2.3.2 带有特定格式的DeepSeek在线调用 33
2...
(2)即时金融信息采集与分析平台、智能医疗问诊系统、多Agent跨境电商智能客服系统分别代表金融、医疗、电商行业的应用解决方案。特别是多Agent跨境电商智能客服系统,融合了A2A、MCP、RAG技术,其系统分析与代码实现过程的讲解就值书价了,有需要借鉴此案例的读者可以大胆购买。
(3)《DeepSeek原生应用与智能体开发实践》还可以结合《DeepSeek大模型高性能核心技术与多模态融合开发》一书中的案例,对DeepSeek原理与应用开发进行深入研究。
(4)《DeepSeek原生应用与智能体开发实践》围绕DeepSeek大模型应用开发展开,深度融合技术创新与工程实践,内容覆盖大模型应用开发(在线调用、提示词、推理、Agent、工具调用、MCP、微调、蒸馏、后训练、RAG)常用技术栈。
(5)《DeepSeek原生应用与智能体开发实践》原理与实战案例相融合,注重培养读者的大模型原生应用与AI Agent智能体开发能力,并构建从理论到落地的完整知识体系。
(6)《DeepSeek原生应用与智能体开发实践》通过代码级详解与量化实验对比,将KV Cache、MLA注意力、MoE专家模型、MTP输出等前沿技术转化为可复现的工程能力,帮助读者深入理解大模型的技术逻辑。
(7)配套示例源码、数据文件、PPT课件、配图PDF文件、读者微信交流群。"