大语言模型基础教程
《大语言模型LLM通识》由计算机科学与技术专业资深讲师撰写,结合理论深度与实践需求,系统讲解大语言模型的核心原理和**技术发展,帮助高职学生打下坚实的理论基础,并为未来的实际应用提供指导,是学习大语言模型不可多得的专业教材。

作者:张永涛 李璟

丛书名:计算机类技能型理实一体化新形态系列

定价:59.8元

印次:1-1

ISBN:9787302705024

出版日期:2025.12.01

印刷日期:2025.12.16

图书责编:张龙卿

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

" 本书系统构建大语言模型的知识体系,内容从技术演进、核心原理到行业实践层层递进。其中,“基础篇”以技术发展脉络为轴,详细介绍从Word2Vec 、Transformer 到GPT 系列模型的架构革新,深入剖析自注意力机制、预训练—微调范式及模型优化策略,并探讨如何应对数据质量、能耗效率与实时性能调优等问题。“应用篇”覆盖自然语言处理、医疗、金融、法律等八大领域的落地实践,结合智能问答、文本生成等场景,拆解Prompt 工程方法论,并同步探讨大语言模型引发的就业变革、隐私风险与伦理争议。“前沿篇”聚焦多模态融合(视觉—语言交互、语音合成)、大语言模型可解释性(金融合规与医疗透明性需求)、对抗性攻击防御等关键技术突破,并展望超大规模模型、新型架构与全球协作的未来图景。 本书既是人工智能开发者与自然语言处理工程师的技术全景图,也是产品经理与行业决策者的实践指南。通过跨领域应用解析(如医疗文献解析、金融风控自动化),助力初学者掌握大语言模型核心架构与训练逻辑,同时为从业者提供Prompt 优化、多模态开发等进阶工具。本书也适合作为高校师生及相关研究机构的教材或参考用书。"

张永涛,男,副教授,主要从事计算机方面的教学及科研工作,发表计算机方面论文10余篇。教授的课程:《大数据模型》、《嵌入式软件开发基础》、《人工智能技术》、《计算机网络原理》、《操作系统原理》、《数据分析》等。

在人工智能技术迅猛发展的今天,大语言模型已成为推动自然语言处理、多模态交互及行业智能化转型的核心驱动力。从早期的词向量模型到如今的千亿级参数模型,大语言模型不仅重塑了技术研发的范式,更在医疗、金融、教育、法律等领域展现出前所未有的应用潜力。本书旨在为读者提供系统性学习大语言模型的理论框架与实践指南,助力学术界与产业界把握这一技术浪潮的机遇。 1.行业背景与产业需求 近年来,大语言模型通过海量数据训练与自监督学习,逐步突破了传统自然语言处理的局限,实现了文本生成、语义理解、跨模态交互等复杂任务。以GPT系列、BERT、Transformer为代表的模型架构革新,推动了智能客服、自动编程、医学诊断等场景的落地应用。例如,在医疗领域,大语言模型可辅助解析医学文献并为临床决策提供参考信息;在金融行业,其能高效分析市场动态与风险数据,成为决策支持的重要工具。然而,模型的可解释性、伦理安全及能源消耗等问题仍亟待解决,这要求技术与应用的双向优化。 2.本书特色与结构设计 本书基于理论与实践结合的理念,系统梳理大语言模型的技术脉络与应用场景,具有以下特色。 (1)从基础到前沿的全覆盖:“基础篇”深入解析大语言模型的核心原理,涵盖Transformer架构、训练优化策略及环境影响,为读者构建扎实的理论基础;“应用篇”聚焦行业应用,通过医疗、法律、金融等领域的案例分析,展现技术落地的多样性与创新性。 (2)实战导向与前沿探索:专设“Prompt的使用与优化”“大语言模型的多模态融合”等章节,结合代码示例与优化技巧,指导读者解决实际开发中的难题;“前沿篇”探讨可解释性、安全性与未来趋...

目录
荐语
查看详情 查看详情
基 础 篇

第1章 大语言模型的起源与发展 2

1.1 从自然语言处理到大语言模型 2

1.1.1 自然语言处理的基本概念 2

1.1.2 早期自然语言处理方法与技术 3

1.1.3 兴起的大语言模型:革新与潜力 5

1.2 重要的里程碑与发展阶段 7

1.2.1 Word2Vec和GloVe:向量化的起点 7

1.2.2 从RNN到LSTM:序列模型的演进 11

1.2.3 Transformer和BERT:自注意力机制的崛起 14

1.2.4 GPT系列:大规模预训练模型的突破 15

1.3 大语言模型的未来展望 18

1.3.1 从GPT—4到GPT—N:未来可能的发展 18

1.3.2 国内大语言模型的发展 21

1.3.3 多模态和跨语言的挑战 23

1.3.4 对可解释性、公平性和安全性的追求 25

第2章 大语言模型的核心原理与技术 27

2.1 深度学习与神经网络 27

2.1.1 深度学习的基本原理 27

2.1.2 神经网络的组成与工作方式 29

2.1.3 神经网络的类型和适用场景 32

2.1.4 深度学习在大语言模型中的应用 34

2.2 词向量与语义表示 36

2.2.1 词向量 36

2.2.2 主要的词向量模型 37

2.2.3 词向量的实际应用场景 40

2.2.4 语义表示 42

2.3 Transformer与自注意力机制 45

2.3.1 Transformer的原理和架构 45

2.3.2 自注意力机制的理论和实践 46

2.3.3 Transformer在大语言模型中的应... 查看详情

本书作者有多年的企业从业实际工作经验,教材定位准,内容实用,有大量的实用案例,适合学生和从业者学习。编辑QQ 1102528884


查看详情