记者日前从西安交通大学获悉:该校叶凯教授团队在基因注释核心方法上实现重要突破,其成果在线发表于国际顶级期刊《自然·方法》。
基因注释是连接“测出基因组”和“读懂基因组”的核心环节,是基因组研究走向功能解析和应用转化的重要基础。随着国际大型基因组计划持续产出海量数据,如何实现高质量基因注释已成为后基因组时代亟待突破的重要瓶颈。
据叶凯介绍,传统方法通常依赖RNA测序、同源蛋白等外部证据,存在数据需求高、计算开销大、对数据匮乏物种适用性受限等问题。
针对这一挑战,叶凯教授团队提出了一种基于混合专家架构的基因组语言模型ANNEVO。该方法能够同时学习不同生物类群的进化规律和长距离序列上下文关系,在无需RNA测序和同源蛋白等外部证据的条件下,仅凭DNA序列即可实现高精度从头基因注释。这打破了国外团队在该领域的技术垄断,推动我国在基因注释核心方法上实现重要突破,对于服务国家生物安全战略、AI+生命交叉融合发展具有重要意义。
叶凯教授团队长期围绕“人工智能驱动基因组解析”开展系统布局,此前已取得一系列成果。此次成果进一步完善了团队在“AI驱动基因组解析”方向上的系列工作布局,形成了从基因组变异识别到基因功能注释的连续方法链条,已在国际旗舰基因组计划场景中展现出重要应用价值。
(记者 吕扬)
编辑:韩睿