清华交叉信息研究院曾坚阳课题组和药学院陈立功课题组合作发表药物-标靶相互作用预测的新颖机器学习算法 - 中国

 新浦京科技     |      2020-01-27

图片 1

清华大学交叉信息研究院曾坚阳课题组和药学院陈立功课题组合作开展的关于大规模异构网络中药物-标靶相互作用预测的论文《基于异构网络信息整合的药物-靶标相互作用预测和药物的重新定位》( A Network Integration Approach for Drug-Target Interaction Prediction and Computational Drug Repositioning from Heterogeneous Information)于近日发表在《自然·通讯》(Nature Communications)期刊上。该项研究工作提出了一套新颖的预测药物-标靶相互作用的机器学习算法,预测并发现了新的药物-标靶基因相互作用关系,并且得到了湿实验验证。该工作对大规模生物数据整合及预测、药物开发与重新利用具有很大意义。

人体的机制是奇妙的,但他们并没有放弃所有的秘密。为了真正克服人类疾病,了解最基本水平的情况至关重要。

药物-标靶相互作用预测是药物发现和重定位的关键步骤。大规模基因组、化学和药理数据的出现为药物-标靶相互作用预测提供了新的机会,但如何系统且高效地整合大规模异构数据是当前的研究难点。曾坚阳课题组和陈立功课题组提出了一套全新的药物-标靶相互作用预测方法,该工作从目前已有的大规模数据库出发,构建了一个涵盖描述标靶基因、药物、药物副作用、疾病等相互作用或者联系的大规模异构网络。

细胞的基本功能由蛋白质分子进行,蛋白质分子以不同的复杂性相互作用。当病毒进入体内时,它会破坏它们的相互作用并操纵它们进行自身的复制。这是遗传病的基础,了解病毒如何运作是非常有趣的。

另外,在异构网络数据的基础上,两个研究组共同提出了一个基于网络扩散的药物-靶标相互作用预测的机器学习算法。该算法使用特征学习算法,用低维表示刻画了每一个药物及基因的拓扑性质,从而去除生物数据中的噪音,提取出药物和基因的功能信息,并提升预测的准确性。与现有常见的预测算法的比较,该方法在预测准确率上取得了显著的提高。此外,该方法所预测的新相互关系大部分能够从已知的数据库或者近期文献中的新结果获得证实。

像病毒这样的对手激发了明谢谢电子与计算机工程系副教授Paul Bogdan和最近的博士学位。来自USC网络物理系统小组的毕业生Yuankun Xue,确定他们与人体内蛋白质的相互作用。我们试图用数学模型重现这个问题,波格丹说。他们开创性的统计机器学习研究重建失败的复杂网络以对抗对抗性干预,发表在今年4月早些时候的自然通讯杂志上。

曾坚阳研究组进一步同清华大学医学院的陈立功实验室进行合作,对该方法预测的且未被之前研究工作所报道的药物-靶标相互作用关系进行实验验证。实验发现,该方法预测的存在于胺丁羟磷酸盐(Alendronate),替米沙坦 (Telmisartan)和氯磺丙脲 (Chlorpropamide)这三种药以及PTGS1和PTGS2这两种标靶基因之间的作用关系在实验中确实显现了相互作用现象。对这些药物对靶标的下游基因表达的影响的进一步分析以及它们对炎症因子表达的影响表明上述几种药也可能具有抗炎症的功能。这一发现对这三个药物的重新定位及后续相关研究具有重要的意义。

薛博士获得博士学位。去年获得2018年最佳论文奖的电气和计算机工程学院表示:了解关键蛋白质和基因的无形网络具有挑战性,对于设计针对病毒甚至癌症等疾病的新药或基因疗法极为重要。

该项工作的合作者还有美国伊利诺伊大学香槟分校彭健教授研究组。该论文的共同第一作者为交叉信息研究院计算机科学实验班2012级本科生罗宇男(目前在美国伊利诺伊大学香槟分校攻读博士学位)、药学院博士生赵心彬以及药学院2012级本科生周镜天(目前在美国加州大学圣地亚哥分校攻读博士学位)。论文通讯作者为曾坚阳教授、陈立功教授和彭健教授。研究工作得到国家自然科学基金、中组部青年千人计划和清华大学结构生物学高精尖创新中心的经费支持。

蛋白质相互作用网络将每种蛋白质模拟为节点。如果两种蛋白质相互作用,则会有一条连接它们的边缘。薛解释说:病毒攻击类似于删除该网络中的某些节点和链接。因此,原始网络不再可观察。