前言
大模型是大规模语言模型(Large Language Model)的简称。大模型主要指具有数十亿甚至上百亿参数的深度学习模型,其具备大容量、大算力、多参数等特点。大模型由早期的单语言预训练模型发展至多语言预训练模型,再到现阶段的多模态预训练模型。随着人工智能技术的发展和应用场景的不断扩大,大模型从最初主要应用于计算机视觉、自然语言处理发展到目前逐渐应用于医疗、金融、智能制造等领域。这些领域都需要处理大量的数据,运用大模型可实现处理多任务的目标。大模型不仅能够提供更高效、更精准的解决方案,也逐渐成为人工智能领域的重要发展方向之一。
大学作为传播知识、科研创新、服务社会的主要机构,为社会培养具有创新思维的现代化人才责无旁贷,而具有时代特色的书籍又是培养专业知识的基础。本书依据当今信息社会的发展趋势,基于工程教育教学经验,意欲将大模型开发知识提炼为适合国情、具有自身特色的创新实践教材。作者总结了30个案例,以期推进创新创业教育,为国家输送更多掌握自主技术的创新创业型人才。
本书的内容和素材主要来源于以下几方面: 作者所在学校近几年承担的教育部和北京市的教育、教学改革项目与成果; 作者指导的研究生在物联网方向的研究工作及成果总结; 北京邮电大学信息工程专业创新实践。该专业学生通过CDIO工程教育方法,实现创新研发,不但学到了知识,提高了能力,而且为本书提供了第一手素材和资料,在此向信息工程专业的学生表示感谢。
本书的编写得到了教育部高等学校电子信息类专业教学指导委员会、信息工程专业国家第一类特色专业建设项目、信息工程专业国家第二类特色专业建设项目、教育部CDIO工程教育模式研究与实践项目、教育部本科教学工程项目、信息工程专业北京市特色专业项目、北京高等学校教育教学改革项目的大力支持,特此表示感谢!
由于作者水平有限,书中难免会存在不当之处,敬请读者不吝指正,以便作者进一步修改和完善。
李永华于北京邮电大学2025年3月