前言近年来,人工智能产业在全球范围内方兴未艾,它对国家政治、经济发展乃至国际影响力都产生了巨大影响。人工智能的研究和应用,如模式识别、机器学习、深度学习、计算机视觉等,都在很大程度上依赖于共同的奠基之石——数学基础。
截至2024年年初,全国共460余所高校开设了人工智能专业。可是人工智能所涉及的数学知识,如凸优化、信息熵、随机采样等,都超出了以往本科生和研究生的学习范围。与此同时,目前高校普遍存在的问题是,工科生擅长动手实践,但理论知识薄弱,无法以理论驱动应用技术的进步;理科生虽熟悉理论知识,却不擅长动手实践,很难做到学以致用,本书正是基于这样的背景而编写的。
本书共13章,覆盖了人工智能领域各个方面的基础理论知识。第1~6章分别是微积分基础、迭代优化与凸函数、向量空间、矩阵的特征分解与压缩、概率论基础和数理统计基础,这6章着重介绍与人工智能相关的高等数学、线性代数和概率统计基础知识。第7~13章分别是线性模型、熵与不确定性、大规模矩阵分解、迭代优化方法、深度学习基础、随机方法和模型评估,这7章侧重于数学理论与人工智能应用的有机结合,它们建立在前6章的基础之上。
本书多个章节的知识点和案例都结合了模式识别和机器学习的相关内容,所有案例的代码编写和运行结果都由编著者设计并验证。为了把重要知识点讲解透彻,书中每章都大量融入了理论知识的论述、分析和解释。编著者撰写了绝大部分章节的补充说明,受到纸质书稿的篇幅限制,可通过扫描文末二维码获得本书配套的附录和章节补充说明文件。
为帮助读者更高效地掌握人工智能的数学知识,本书的编写具有以下几方面特点。
案例驱动、理论易懂
本书用案例引出数学知识,深入浅出地引导初学者入门,做到理论联系实际。例如,第5章从理论角度介绍了概率变换,并阐述了正态分布与统计学三大分布的关系。初学者可以先看第6章末尾的案例,即计算机生成标准正态随机数,通过相应的映射,变换成三大分布。运行结果直观展示了变换前后的分布直方图,以及各自的置信区间。
知识融合、前后贯通
本书各章节之间做到了有机结合。例如,第7章从线性空间和优化建模两个方面解释了线性方程组的最佳近似解;统计学中无偏估计用于第10章批量随机梯度法的收敛性解释,以及第12章蒙特卡罗法的案例中;统计学中两类错误和t分布的查表计算用于第13章两类样本的区分度和分布差异判定评价等。
图文并茂、难易分明
本书图文并茂,难易层次分明。每章既有直观的编程案例,又有数学公式、理论推导和分析解释。绝大部分章节的补充说明(扫描文末二维码获得)旨在追根溯源并把重要的知识点解释清楚,例如伽马分布的由来、相似变换的物理意义、交叉熵用于逻辑回归分类的案例等。
知识拓展、便于延伸
本书引导感兴趣和学有余力的读者查阅文献并深入学习。例如,第1章提到,日本数学家高木贞治用拉格朗日中值定理证明了泰勒展开式对一切函数皆成立,并给出相应文献;第3章提到,施密特正交化可消除信号干扰,也可用于QR分解和Krylov空间,并给出相应文献等。
内容前沿、与时俱进
本书既介绍了人工智能领域的传统数学知识,又引入了近年来最新的热点。例如,第5章提到,语言大模型建立在条件概率的基础之上;第9章末尾介绍了矩阵分解并行化软件库,以及并行化的发展方向;第10章给出了PyTorch工具包自动求导的编程案例,也介绍了深度学习几种最新的优化方法等。
本书配套资源丰富
为方便读者教学、学习,本书配套以下资源:PPT教学资源、微课视频,所有案例的完整源代码,附录和绝大多数章节补充说明内容,每章课后习题和答案。以上资源可通过扫描书中二维码获取。
本书内容较多,对人工智能的数学知识覆盖面较广,一般以两个学期课程为宜。在教学过程中,可结合学校办学定位和培养目标进行适当取舍。案例和相关数学概念,适合于应用型高校本科生;案例和数学理论推导,适合于学术型高校本科生;理论解释、知识外延及电子版的章节补充说明,适合于研究生。
本书整个撰写过程历经三年,耗费了编著者大量的时间和精力。非常感谢张燕副校长的提点和指导,自本校2019年智能科学与技术专业成立以来,她一直负责该专业的建设工作。由于之前全国所有高校从未专门开设过“人工智能数学基础”课程,市面上没有合适的教材。在她的提议和指导下,作为课程负责人的编著者于2020年开始酝酿,2021年正式起草本书。在撰写过程中,张燕副校长给出了宝贵的指导意见,强调内容要深入浅出,以案例驱动教学,要突出理论与实际相结合。
本书是编著者三年来在教学科研过程中不断实践、总结和持续改进的结果。书中难免会有不当之处,请读者不吝赐教。
陶玉婷于南京2024年3月
附录和章节补充说明文件.zip案例源代码.zip课后习题及答案.zip人工智能数学基础