党的二十大报告指出: 教育、 科技、 人才是全面建设社会主义现代化国家的基础性、 战略性支撑。 必须坚持科技是第一生产力、 人才是第一资源、 创新是第一动力, 深入实施科教兴国战略、 人才强国战略、 创新驱动发展战略, 开辟发展新领域新赛道, 不断塑造发展新动能新优势。 高等教育与经济社会发展紧密相连, 对促进就业创业、 助力经济社会发展、 增进人民福祉具有重要意义。
人工智能(AI) 的发展日新月异, 大语言模型(Large Language Model,LLM) 作为这一技术浪潮的 代 表, 在 近 年 来 取 得 了 令 人 瞩 目 的 突 破。 从 早 期 的 统 计 语 言 模 型 到 今 天 的Transformer 架构等, 大语言模型不仅推动了自然语言处理领域的巨大进步, 而且掀起了全球范围的 AI 应用热潮。 GPT、BERT 等模型不仅刷新了人们对 AI 技术的认知, 也深刻改变了教育、 医疗、 金融、 传媒等诸多行业, 成为助推数字化转型与智能化升级的重要引擎。然而, 面对大语言模型的迅猛发展, 我们作为应用型高校, 很难找到系统介绍 LLM 理论与应用的综合性教材。 虽然技术资料与碎片化信息随处可见, 但真正能从基础理论、 方法实践到行业应用提供全面指导的书籍却寥寥无几。 基于此背景, 我们组织团队编写了本书,希望能为大模型学习者提供一本兼具系统性、 前沿性和实用性的学习指南。
本书以“系统讲解理论、 全面展示实践、 深入探讨应用”为特色, 力图为读者提供完整的大语言模型知识体系与实践工具。 本书不仅详细阐述了 Transformer 架构、 大语言模型的演化、 数据预处理、 提示工程、LLM 微调技术等 LLM 技术的核心知识, 还探讨了检索增强生成(RAG) 技术、 智能体技术(AI Agent) 、 大模型本地部署、 多模态模型、 AI 编程工具、LLM 评估以及 LLM 的伦理安全与未来等最新研究进展, 并通过具体案例演示这些技术如何有效应用于真实场景, 为典型的行业基础应用提供了具体可行的代码实例。
全书共分为12 章, 每章采用理论与实践相结合的方式编排, 章末设有实验、 小结、 思维导图、 习题以及 AI 科学家传奇或 AI 科技小故事等, 旨在进一步巩固知识, 拓宽视野, 激发读者的进取精神与创新灵感。
第1 章为走进大语言模型, 从生活场景认识大语言模型, 系统介绍 LLM 的发展史及特征和功能, 揭示 LLM 正在重塑人们的工作和生活的方方面面。
第2 章为大语言模型的核心原理, 重点阐述 Transformer 架构以及编码器与解码器的演化, 并引入提示词工程及使用技巧。
第3 章为数据集预处理, 阐述预处理的重要性和流程, 解析数据质量与大模型性能的关Ⅱ联, 重点讲解预处理技术和数据合规性。
第4 章为大语言模型微调与优化, 详细介绍 LLM 微调的基本概念、 方法、 工具、 实践案例及优化技巧, 通过动手微调理解大模型如何更好地适应具体任务需求。
第5 章为 RAG 技术, 系统解析检索增强生成的技术框架与行业实践, 详解 RAG 的关键技术与实战部署。
第6 章为智能体技术入门, 阐述智能体的基本原理、 技术框架及工作流程, 并用详细实验介绍如何搭建智能体工作流。
第7 章为 AI 编程工具与大语言模型, 简要介绍国内外常见 AI 编程工具及其技术对比, 并通过 AI 编程案例展现其强大功能和应用趋势。
第8 章为多模态大语言模型, 介绍 MLLM 的理论基础、 关键技术与实际应用, 并通过实验掌握跨文字、 图像、 音频等多种信息形式的智能化交互和应用。
第9 章为本地大语言模型部署, 深入剖析本地运行 LLM 的战略价值与核心优势, 为企业和开发者提供本地部署与云端部署的对比, 并具体实践 DeepSeek 本地部署。
第10 章为大语言模型的应用, 详细阐述 LLM 在生活和行业中的实际应用, 并配备四个典型的实验帮助读者深入浅出地理解 LLM 的应用。
第11 章为大语言模型的评估, 介绍 LLM 的评估指标和方法, 旨在通过典型的实践, 帮助读者深入理解模型真实能力, 以规避应用中的潜在风险。
第12 章为伦理、 安全与未来, 探讨 LLM 应用中涉及的伦理、 安全挑战和未来展望, 并介绍 LLM 的技术发展趋势。
本书具有以下特色:
(1) 系统完整、 高效跃迁。 本书详细阐述 Transformer 架构、 数据预处理、LLM 原理及演化等核心知识, 并深入探讨 LLM 微调、 检索增强生成(RAG) 、 智能体、AI 编程、 多模态、本地部署及评估、 伦理、 安全、 未来发展等最新研究进展, 内容采用模块化、 递进式组织, 引领读者高效掌握完整的大语言模型知识体系, 迅速实现从入门到精通的跃迁。
(2) 实战为王、 理实交融。 本书强调理论与实践的深度融合, 通过具体的行业基础应用案例, 详细展示前沿技术在真实场景中的有效运用, 并提供具体可行的代码、 实例, 实现知识与应用能力的无缝衔接。
(3) 前沿导向、 直击热点。 本书力图为读者提供大语言模型前沿的知识体系与流行的实践工具, 题材选择直击当前 LLM 流行热点, 帮助学习者尽快掌握行业应用的全链条知识, 站在人工智能应用的前沿。
为便于教学, 本书提供丰富的配套资源, 包括教学大纲、 教学课件、 电子教案、 程序源码、教学进度表、 在线作业和习题答案。
资源下载提示
• 课件等资源: 扫描封底的“图书资源”二维码, 在公众号“书圈”下载。
• 素材(源码) 等资源: 扫描目录上方的二维码下载。
• 在线自测题: 扫描封底的作业系统二维码, 再扫描自测题二维码, 可以在线做题及查看答案。Ⅲ
本书适合对象广泛, 既可作为高等院校人工智能、 计算机科学与技术相关专业教材, 也可作为科研人员、 工程师、 技术开发人员和行业从业者的专业参考书。 同时, 本书也适合对人工智能、 大语言模型感兴趣的广大读者和爱好者阅读, 帮助他们更好地理解并应用这一技术。
本书由高仑、 付杰、 张福利、 何会兴、 丁宁、 王煜林共同编写, 第1 章由丁宁编写, 第2 章由高仑、 石菊奇编写, 第3 章由宁安安编写, 第4 章由何会兴编写, 第5 章由丁宁编写, 第6章由杜绵吾编写, 第7 章由何会兴、 高仑编写, 第8 章由冯文婕编写, 第9 章由高仑编写,第10 章由付杰编写, 第11 章由张仁潮编写, 第12 章由胡敏敏编写, 全书由张福利、 王煜林
统稿。
我们深知, 大语言模型的发展是一条没有尽头的探索之路。 随着技术的进步与实践的积累, 未来一定会出现更多新技术、 新方法和新应用。 衷心希望读者通过学习本书, 能够掌握扎实的基础知识与实践技能, 更好地迎接未来技术的挑战与机遇。最后, 感谢各位编委成员为本书付出的辛勤劳动, 感谢所有提供帮助与支持的专家学者, 以及出版社的编辑团队, 正是大家的共同努力才使本书得以顺利出版。 同时, 我们也诚恳地欢迎广大读者不吝赐教, 帮助我们进一步改进与完善本书的不足之处。希望本书能够成为您探索大语言模型世界的良师益友, 助您在人工智能的旅途中迈出更加坚定的步伐。
编 者
2025 年10
