在对信源和通道先验知识甚少的情况下,仅由观察信号推断信源和通道的特性,称为盲信号处理,其中包括盲辨识、盲解卷、盲信源分解等问题。独立分量分析(ICA)是和后者密切相关的,它是信号处理技术发展中的一项前沿热点。 传统的信源分解技术建立在主分量分析的基础上,分解出的诸分量只是互相正交且依能量大小排序,因而有明显的局限性。ICA的目的是: 从多通道测量所得到的由若干独立信源线性组合成的观察信号中,将这些独立成分分解开来。因此,被分解出的诸分量更容易具有实际的物理或生理意义。生产及生活中符合这种条件的情况很多,例如,在嘈杂的环境中提取关心的某些声音; 又例如,人体内蕴藏着多种多样的生理信号源,它们一般是互相独立的,而由体表测得的信号总是这些信源所发信号的混合体,因此采用ICA技术将它们加以分离,这将有助于对生理信号机理的进一步认识。
正是由于其重要性,2000年以来几乎每年均有关于ICA的国际学术会议召开。一些权威的学术刊物(如Neurocomputing, IEEE Trans.on BME, Proc. IEEE, IEEE Trans. on SP 等)相继出版了有关专辑。 Internet上有关ICA的学术站点与讨论也在不断增加。就研究内容来看,早期工作集中于线性代数混合的情况,近期除进一步改进这类情况的有关算法并推广其应用外,更注意探讨如何解决一些更深入的难题,如各信号间有传递延迟、传递过程中与通道发生卷积、系数时变、空间独立而时间相关,以及非平稳、非线性等情况。
1998年以来国外已有五、六本关于ICA的专著,而国内则尚未见类似专著出版。一些高等院校虽然已有一些研究生从事这方面工作,但缺少从原理上作深入浅出系统介绍的读物,往往只是从网站上下载一些有关软件,便囫囵吞枣地加以应用。为了弥补这一缺陷,作者结合自己的教学经验,用两年时间编写了这本便于自学的著作。全书共分9章,主要内容可概括如下:
除第1章对ICA问题的含义、提出、历史与现状作一简述外,其后各章大致可分为五个主要部分:
1. 预备知识为本书涉及的主要基础理论进行简述、复习与扩展。其中主要包括: 概率与统计特征; 信息论基础知识,介绍熵、互信息、KL散度、负熵的含义和性质; 线性变换对上述诸特征的影响及概率密度函数的展开。
2. 优化判据由于独立分量分解本质上是个优化问题,因此首先讨论优化的判据,力图从统计信号处理及信息论基础上,把形形色色的判据纳入统一框架之内,说明其共性与个性、联系与区别是本书的一项特色。
3. 优化算法概括成三种主要类型: 成批数据的处理; 随着数据输入的自适应更新处理; 每次只提取一个关心成分的“逐次剥皮”处理。 这部分内容的介绍分成三章进行,是本书的重点内容。除介绍广泛应用的Maxkurt、 JADE、 Infomax、 固定点ICA(即快速ICA)、非线性PCA等算法外,还简介了一些其他引申。每章最后都有应用举例。注意阐明有关公式的导出是本书的另一项特点。
4. 进一步问题其中包括有时间延迟及卷积组合的情况和近几年来深受研究者注意的稀疏分量分析,这些问题属于有待发展的前沿问题。书中明确指出问题的提法,并较全面地归纳出已经提出的解决问题的途径。这样的归纳整理,在国外已出版著作中也不多见。
5. 应用以ICA在生物医学信号与图像分析中的应用为结合点,从生理信号的增强、去噪、单次(少次)提取、医学图像与电生理信号的信息融合以及人脸图片识别等方面综合介绍前几章中各方法的应用及注意事项。
用“ICA网络资源概要”作为全书的后记也是本书的特点。由于从撰稿到出版所需周期较长,在此期间该学科方向必定又有长足进展,而印刷资料不可能随时更新。随着网络技术的发展,研究人员可以迅速从网上获知所关心问题的最新信息。为了使读者能与时俱进地及时获知这些新动向,本书在后记中把国际上在ICA研究领域内成果比较领先、资源也比较丰富的研究单位的网址及其概况作一粗略介绍,以便读者访问。
虽然本书应用举例多是结合生物医学工程专业的需要取材的,但书中阐述的基本原理是具有普遍意义的。我们希望此书的读者能遍及多种学科,包括信号处理、人工神经网络、信息工程、神经及认知科学以及应用数学等领域的本科生、研究生、教师及研究人员。因此,尽管书中资料参考了大量文献,但在编写时仍努力使叙述自成体系,以增强其可读性。读者只要具有关于微积分、矩阵代数、概率论和统计学的基本知识就能理解本书内容。
全书主要章节由杨福生撰写,洪波主要负责后记和网上资料的收集,并负责本研究室研究成果的整理。限于作者的水平,书中错误和遗漏在所难免,恳请读者批评指正。
编者
2005年4月