近日,河南省农业科学院动物疫病防控研究所药物设计团队先后在International Journal of Molecular Sciences、Molecular informatics和Virus等JCR一区杂志发表了基于人工智能算法的多肽-蛋白亲和力预测模型及其优化的系列研究;团队以猪流行性腹泻病毒S蛋白为靶点,在体外实验中验证了所设计多肽的高效性和显著抗病毒效果,为后续猪腹泻的临床治疗奠定坚实的技术基础。
肽-蛋白相互作用是许多生物过程的关键,如信号传导、免疫应答、酶催化等,研究肽的亲和力和特异性对于开发新的肽类生物药物和预防策略具有重要意义。随着计算机科学的发展和计算机性能的提高,虚拟对接方法成为一种分析肽-蛋白相互作用的常用的方法,但是这些方法主要依赖于对肽和蛋白之间的各种相互作用力进行计算进而对亲和力进行评估,由于目前尚未有成熟的对多肽和蛋白质之间的实际亲和力评估的工具,因此并不能准确反映肽的真实亲和力。
本研究团队以虚拟对接数据与多肽-蛋白质的实际亲和力数据相结合,利用6种流行的人工智能算法进行建模分类,通过特征筛选得到决定模型分类性能的四种重要特征(INTRA.VDW0, INTRA.DIHEDRAL0, HEAVY, 和 INTER.ROT),构建了三个基于不同重要特征的随机森林模型,并证明了模型的有效性和可靠性。同时,本研究团队进一步比较了基于树的四种不同算法,包括分类和回归树(CART)、C5.0决策树(C50)、装袋CART (BAG)和随机森林 (RF)。结果表明,C50模型在未知数据集上具有最高的准确性(80.4%),并且与其他模型的预测结果具有高度相关性,表明其具有潜在的稳定性和鲁棒性。
由于猪流行性腹泻病毒(PEDV)的快速变异,现有疫苗无法为猪提供足够的免疫保护。本研究团队利用多肽筛选模型,快速筛选出能特异性识别 PEDV S1 C-端结构域(CTD)蛋白的亲和肽。结果表明,多肽110766的 P/N 值达到167,亲和力常数达216nM。绝对定量 PCR 的结果显示,不同浓度(3.125 µM、6.25 µM、12.5 µM、25 µM、50 µM)与病毒组相比,多肽110766能显著降低 PEDV的病毒载量(p < 0.0001)。Western 印迹和间接免疫荧光的结果均证明了多肽110766 的抗病毒效果仍然显著。
该团队在生物识别材料(多肽、纳米抗体)和多肽功能预测领域已建立一系列人工智能模型,实现了这些材料的完全虚拟筛选,为后续的应用奠定了坚实的技术基础。该 团队的《靶向高亲和力肽配基理性设计及其应用》成果已获2019年度河南省技术发明二等奖,多肽授权发明专利27项,近三年发表SCI论文17篇,影响因子合计超过110。