前沿丨人工智能学院计智伟课题组提出蛋白互作预测的语言模型
7月21日,生物信息领域重要期刊BriefingsinBioinformatics在线发表了南京农业大学人工智能学院计智伟教授课题组的题为“HNSPPI:AHybridComputationalModelCombingNetworkandSequenceInformationforPredictingProtein-ProteinInteraction”的研究论文。在这项工作中,研究人员借鉴了自然语言处理技术,开发了一种轻量级的蛋白质语言模型HNSPPI,用于预测蛋白-蛋白相互作用。HNSPPI通过整合氨基酸序列信息和PPI网络的拓扑特性,综合表征任一蛋白对之间的内在关系(图1)。研究表明,HNSPPI在人类、酿酒酵母、小鼠等六个基准数据集上表现卓越,预测性能明显优于其他五种现有算法(包括DeepFE-PPI、DeepPurpose等)。最后,HNSPPI模型被用于探索SARS-CoV-2-Human相互作用系统,推理出3个与病毒蛋白S或M有潜在互作关系的宿主蛋白。总之,HNSPPI是一种很有前途的AI模型,可用于鉴定病毒/病原菌入侵宿主后的靶向结合蛋白。图1.HNSPPI模型计算流程