导师序言
本书所展示的研究工作系统、细致、深入,相关结果具有较大创造性及潜在的理论意义和应用前景。
具体来说,本书主要分为三个部分。
第一部分是对蛋白质残基间接触预测方面的探究。在这一部分中,作者应用深度信念网络与残差网络,提出了分级的、模块化的网络架构,同时革新训练手段,开发了预测方法DeepConPred2。在严密客观的测试中,该方法的预测表现在当时(2018年9月)处于世界领先水平。
在第二部分与蛋白质残基间距离预测相关的研究中,作者提出了与主流方法不同的预测思路。具体来说,主流方法将残基距离离散化后预测相关的概率分布,而作者采用生成式对抗网络对实值距离直接进行回归预测。此外,这部分研究的创新性还包括引入基于分子动力学模拟的数据增广方法,设计了正实数到[-1,1]区间之间的可逆映射函数,分析总结了这一领域不同技术选择带来的不同效果等。
第三部分则是作者在前两部分基础上对蛋白质结构模型的搭建做出的探索。这部分工作以梯度下降为基本原理,引入了许多在此领域中从未出现的新算法,创造性地设计并实现了一个基于深度学习的模块化的蛋白质结构模型预测框架。经测试,相关框架和传统的成熟方法表现相当,甚至在某些情况下性能更好。
此外,在本书中,作者还介绍了其所参与的其他相关工作。
总的来说,本书所展示的研究工作,其内容层层深入,系统性和创新性很高,体现了其较为深入的思考与探索,相关学术成果严谨扎实。
龚海鹏副教授
清华大学生命科学学院