图书前言

  金融是现代经济的核心与国民经济的命脉。2023年中央金融工作会议提出加快建设金融强国的宏伟目标,把金融高质量发展定位为以中国式现代化全面推进强国建设、民族复兴伟业的有力支撑。

  在国际金融秩序变局前景下,金融市场、资产定价与风险分析等金融问题已呈现出前所未有的复杂态势。高素质金融人才对于金融业的实践创新、理论创新与制度创新具有举足轻重的作用,是当下金融强国建设的核心要素。随着大数据与人工智能等信息技术的飞速发展,金融行业亟须培养掌握先进分析工具、具备持续学习能力的复合型创新人才,以提升金融服务水平、市场效率,增强风险防控能力,促进科学监管与数字化治理体系的建设,最终实现金融高质量发展。

  在新质生产力体系中,数据已然成为不可或缺的基本生产要素。同样,在金融体系中,数据也占据着举足轻重的基础地位。正如风起于青萍之末,金融体系的宏观现象都起源于微观基础。金融体系的运行时刻都在产生数据,这些数据蕴含着信息和价值。全面收集和精确分析金融大数据,需要充分认识其多维度、实时性、海量性和异构性四个特征。在多维度方面,金融大数据覆盖微观个体交易和宏观经济指标,不仅包括传统财务指标和市场交易数据,还包括宏观经济数据和政策变化。通过对金融数据从产生到传播的全流程进行实时处理,交易者与监管机构能迅速识别并响应市场异动,提高决策时效性。金融市场产生的交易记录和资产价格更新伴随着海量数据,对这些数据的科学处理与分析有助于揭示市场的深层规律,提取金融市场变量在深层次时空维度上的变化模式。异构性指的是金融数据来源的多元化,以及时间精度和格式的差异性;这要求我们采用复杂的技术手段进行整合分析,以确保信息的完整性和准确性。

  针对金融大数据的特性,金融从业者需要掌握大数据与人工智能相关的工具方法与研究范式。“谁能把握大数据、人工智能等新经济发展机遇,谁就把准了时代脉搏。”传统计量研究分析方法在处理多模态大数据时存在局限性。高效的人工智能算法能够深入挖掘大数据中蕴含的深层信息,包括识别隐含的、微小尺度的风险源信号,以及捕捉市场异动。这些信息可能成为系统性金融风险的早期预警信号。人工智能可以协助整合金融体系多元数据源,包括结构化的交易记录和非结构化的新闻报道或社交媒体内容,通过深度学习建立理解市场趋势、预判风险的预警系统。例如,自然语言处理技术能够分析财经新闻和专家评论,从中提取信息,辅助决策制定;知识图谱可以整合多模态金融数据,揭示不同金融要素之间的相互作用和依存关系,从而揭示隐匿于庞大数据中的风险链和影响因素。这些模型应用机器学习算法,在历史数据基础上学习并分析经济指标的动态特征,如利率变化和资产价格波动。人工智能还可以模拟不同市场情景,协助金融机构评估潜在风险并制定应对策略。

  本书旨在为读者提供系统的机器学习基本概念与原理,以便于初步构建知识体系,掌握应用机器学习算法,了解风险计量、投资组合管理等领域的金融问题解析的流程与方法。对于具有人工智能与大数据相关信息技术背景的读者,本书提供人工智能和机器学习在金融研究中的应用案例。本书兼顾理论与实践。在内容安排上,本书章节从数学或算法原理引入,结合金融实践与学术研究中的问题,叙述机器学习算法的应用。书中所选取案例,如企业风险评估、股价异常检测等,采用了作者与合作者近期的学术成果。除了用图表对数学公式与算法框架进行解释外,本书还列出了包含数据处理与使用机器学习算法工具的Python程序代码,供读者参考。

  本书所采用研究成果受到国家重点研发计划专项课题“2023YFC3305402”的资助。刘彦超、刘赫、艾欣、刘颖、高娜、李敬、周康林和张瑞在本书编辑过程中做出了贡献。