
为什么不同的生物在适应相似的环境时会独立地发展出相似的功能?最新研究从蛋白质“高阶特性”层面揭示了生命进化之谜背后的重要机制。该研究由中国科学院动物研究所邹振婷研究员领导的团队完成。我们成功地将蛋白质语言模型应用于人工智能领域,揭示了蛋白质高阶特性在功能能力趋同进化中的重要作用,为理解生命进化的奥秘提供了新的视角。相关成果近日发表在国际杂志《美国国家科学院院刊》上。突破现有极限的“高阶特征” 趋同进化是自然界中一个有趣的现象。虽然电池鲸鱼是一组进化上截然不同的生物,它们独特地发展了通过回声定位感受环境的能力。科学家长期以来一直专注于探索这种表型收敛的基础的分子机制。传统的研究方法主要集中于蛋白质序列中各个氨基酸位置的收敛变化。但是,有越来越多的证据表明,即使在没有明显的位点收敛的情况下,同源蛋白可以通过构象或物理化学特性的收敛演化来实现功能相似性。研究人员解释说:“这就像用不同的砖块建造具有类似结构的墙。” “尽管氨基酸是不同的,但是物理和化学特性以及整个蛋白质的结构是一致的,因此它们可以实现相似的功能。”人工智能支持了这一科学特征的科学发现。m,邹正廷团队提出了一个名为“accept”的计算机分析框架。该框架的主要创新点在于使用了之前训练好的蛋白质语言模型。这种类型的语言模型是预先训练好的。蛋白质序列数据,可捕获序列内复杂的上下文信息和高阶特征,并将蛋白质序列转化为包含丰富进化信息的高维镶嵌向量。他们能够了解蛋白质最深刻的结构和功能特征,以及其氨基酸序列背后的规则。”研究人员表示。接受分析过程包括三个重要步骤。首先,计算与目标群体同源蛋白质的娱乐向量中的真实距离。接下来,我们通过模拟中性进化过程来构建背景距离分布。最后,对真实距离进行统计检验。在高阶特征收敛的迹象之前。更有趣的是,全基因组筛选结果表明,ACEP 在蝙蝠和鳞类动物中鉴定出了数百个具有趋同信号的候选基因。改进的功能分析表明,一些基因与与回声定位密切相关的功能元件显着相关,例如“感觉知觉”。这些基因不仅发现了已知的回声定位基因,还发现了一些新的候选基因。一些候选基因也得到了正选择证据的支持,并且呈上升趋势。提高自适应收敛的可靠性。研究图谱(中国科学院动物研究所提供)推动了进化生物学的研究范式。该研究首次揭示了高阶蛋白质的特征收敛是适应性进化和破坏的重要机制。通过仅关注氨基酸位点收敛的常规方法的局限性。研究人员Zhenging说:“这项研究不仅加深了我们对生活中进化定律的理解,而且还展示了人工智能技术在分析复杂生物学问题时的强大可能性。我们希望在未来的进化生物学中实现更广泛,更有效的人工智能技术的应用。” ACEP框架为基因组水平上基因的复杂自适应收敛模式的系统采矿提供了一种新工具。专家认为,这一方法论为理解生物适应性进化的分子基础开辟了新的方向,并将参与促进进化生物学研究中范式的转变。对于生物医学和生态学等领域,这一研究发现也非常重要。这项研究得到了民族自然的支持国家自然科学基金委和中国科学院科技战略先导专项项目。 ACEP分析框架的代码目前在Hugging Face平台上共享,供全球科研界使用。 (记者胡哲、彭云佳)