





定价:59.8元
印次:1-1
ISBN:9787302672869
出版日期:2024.09.01
印刷日期:2024.09.06
图书责编:张玥
图书分类:教材
"大语言模型(简称大模型)是一种基于深度学习技术的先进人工智能模型,特别适用于理解和生成自然语言文本,它具有文生文、文生图、文生视频甚至未来的文生X等多种多模态形式。大模型的多功能性和通用性,使其能够在未经专门训练的情况下处理多种类型的自然语言任务。随着技术的发展,大模型已经成为自然语言处理领域的重要基石,并持续推动着人工智能技术的进步和社会应用的拓展。学习大模型课程不仅有利于个人专业成长,更能对社会进步和技术创新产生积极影响。人工智能及其大模型技术,是每个高校学生甚至社会人必须关注、学习和重视的知识与现实。 本书介绍的大模型知识主要包括大模型基础、模型与生成式AI、大模型架构、人工数据标注、大模型预训练数据、大模型开发组织、提示工程与微调、强化学习方法、大模型智能体、大模型应用框架、技术伦理与限制、大模型产品评估等。 本书特色鲜明,易读易学,适合高等院校计算机、大数据、人工智能等相关专业学生学习,也适合对人工智能以及大模型相关领域感兴趣的读者阅读参考。 "
周苏,教授,在浙江大学、浙大城市学院等许多高校专职任教。长期从事计算机专业教学工作,主讲人工智能、大数据技术、创新思维与创新方法等数十余门专业课程,对应用型高等院校教育、职业教育有深刻理解,教学经验丰富,高校课程教材成果丰硕。主编的《大数据导论》(大数据系列丛书)获清华大学出版社2019年度畅销图书。
前言 大语言模型(Large Language Model,LLM),简称大模型,是一种基于深度学习技术的先进人工智能模型,特别适用于理解和生成自然语言文本。大模型通常建立在Transformer架构之上,该架构因高效的并行计算能力和优异的序列学习能力而被广泛应用。大模型的特点在于其庞大的参数规模,通常含有数十亿乃至上千亿级别的参数,这让它们具备更强大的表达能力和泛化性能。大模型通常首先在大规模无标签文本数据上进行预训练,通过监督学习学会预测文本中的缺失部分。微调后,可以适应各种下游自然语言处理任务。通过学习大量文本数据,大模型不仅能解析文本的语法结构和语义含义,还能根据上下文生成连贯,甚至有高度创造性的新文本内容。 相较于传统单一用途的自然语言处理模型,大模型的多功能性和通用性使其能够在未经专门训练的情况下处理多种类型的自然语言任务。代表性的大语言模型有OpenAI的ChatGPT、阿里云的通义千问等。随着技术的发展,大语言模型已经成为自然语言处理领域的重要基石,并持续推动人工智能技术的进步和社会应用的拓展。 学习大模型相关课程,其意义如下。 (1) 理解技术前沿。大模型是人工智能领域的一大突破。学习本课程可以深入了解该领域的最新技术和研究成果,紧跟人工智能发展的步伐。 (2) 提升技能与竞争力。掌握大模型技术可以帮助个人在人工智能、自然语言处理等领域提高技术水平,增强就业竞争力,可以胜任涉及聊天机器人开发、问答系统构建、文本生成、语义理解和翻译等方面的工作。 (3) 创新应用开发。大模型具有强大的语言生成和理解能力,学习本课程有助于启发和引导开发者设计并...
第1章大模型基础1
1.1人工智能基础1
1.1.1人工智能的实现途径1
1.1.2机器学习和深度学习2
1.1.3监督与无监督学习3
1.2大模型定义5
1.2.1模型预训练和微调5
1.2.2大模型的特征5
1.2.3大模型的优势6
1.3大模型技术的形成6
1.3.1Blockhead思维实验7
1.3.2大模型的历史基础7
1.3.3基于Transformer模型8
1.3.4大模型的世界模型问题9
1.3.5文化知识传递和语言支持10
1.4通用人工智能11
1.4.1什么是通用人工智能11
1.4.2大模型与通用人工智能11
1.4.3人工智能生成内容12
【作业】13
【实践与思考】了解典型的开源大模型14
第2章大模型与生成式AI17
2.1什么是语言模型17
2.1.1语言模型的定义17
2.1.2注意力机制18
2.1.3开源还是闭源19
2.2大模型发展三阶段19
2.2.1基础模型阶段20
2.2.2能力探索阶段20
2.2.3突破发展阶段20
2.3Transformer模型21
2.3.1Transformer过程21
2.3.2Transformer结构24
2.3.3Transformer模块25
2.4生成式人工智能26
2.4.1生成式AI定义27
2.4.2生成式AI层次27
2.4.3生成式预训练语言模型GPT29
【作业】30
【实践与思考】基于ChatGPT的免费工具: ChatAI小组件32
第3章大模型架构36
3.1大模型生成原理3... 查看详情