新闻中心

News

公司动态 新冠相关 信息公示

米兰官网-创新方法让AI“见微知著”—新闻—科学网

2025-10-24 16:59:12 999+ 公司动态

     

只管咱们与自身肠道中数以亿万计的微生物“旦夕相处”,但人类对于它们的功效却所知甚少。迄今为止,跨越70%的人体微生物基因功效仍是未解之谜,这些功效未知的微生物基因产品被科学家们统称为微生物组功效“暗物资”。

10月15日,中国农业科学院深圳农业基因组研究所研究员张艳聪团队与哈佛年夜学传授Curtis Huttenhower团队互助,于《天然—生物技能》发表了一项冲破性研究,开发了一种名为FUGAsseM的卵白质功效猜测AI模子,为体系性解析微生物功效“暗物资”提供了全新解决方案。

微生物世界的“暗物资”难题

人体肠道微生物组编码的基因数目是咱们人体基因组编码数目的150倍甚至更多。按照同一人类肠道基因组规划(UHGG)构建的资源库,科学家已经经发明了跨越1.7亿条卵白序列。面临云云重大的卵白质世界,传统的试验要领显患上力有未逮。

“人类微生物组研究面对的最年夜挑战之一,是咱们仍旧不相识年夜大都细菌于详细阐扬甚么作用。”论文配合通信作者Huttenhower指出,虽然该范畴已经成长出很多进步前辈的东西与技能,可以切确丈量微生物组的构成,但对于其功效的解读依然坚苦。

“部门微生物已经被深切研究,但仍有数百种尚不清晰其功效。值患上留意的是,微生物可谓‘化学妙手’,可以或许分化人类没法使用的食品身分,也能转变化合物的布局,使药物孕育发生活性。” Huttenhower说,该项研究的重点就是深切解析微生物组中的卵白质与代谢份子功效,并展现这些作用怎样进一步影响人体康健。

论文独一第一作者、配合通信作者张艳聪告诉《中国科学报》,持久以来,学界重要采用序列相似性原则来猜测未知基因的功效,但因为基因的表达模式差别,这就会致使猜测成果的局限性。

面临这一挑战,该团队另辟蹊径,开发了不依靠在序列相似性的新模式。“FUGAsseM的特点于在它使用多组学数据信息,包括宏转录组中的共表达信息、宏基因组中的共定位信息、序列相似性信息,以和卵白布局相似性信息,整合成多维收集布局,然后使用呆板进修要领来进修这些收集。”

这类要领的焦点是“循证推理”理念。张艳聪用一个活泼的比方注释道:“可以把基因想象成工场里的工人:假如一些工人(未知基因)老是及卖力统一出产线的纯熟工(已经知功效基因)一路上班、一路加班,那他们极可能也于介入一样的出产流程。”

研究团队网络了1595份宏基因组及800份宏转录组数据,这些数据来自对于109人连续一年的追踪研究,每一两周收罗一次样本,终极形成为了高质量的数据集。经由过程这些数据,他们进一步练习AI进修了8万多个已经知功效基因的表达模式,从而让AI具有了猜测未知基因功效的能力。

于处置惩罚数据时,团队还有降服了一个主要技能难题。“宏转录组数据是多个物种混淆的数据集,咱们需要区别基因表达量高是因为拷贝数多,还有是自己表达能力强。”张艳聪团队开发了新的尺度化处置惩罚要领,有用解除了跨物种拷贝数的混合,为AI进修提供了清楚旌旗灯号。

卓着机能:精准猜测的冲破

FUGAsseM于测试中体现优秀。张艳聪先容了两类验证方式:对于已经知功效基因,FUGAsseM可以或许以95%的正确率复现其功效;对于未知基因功效的猜测,采历时间留存验证方式,用2019年的数据练习模子获得猜测成果,等候2022年国际上公然的试验数据验证,成果显示猜测正确率仍旧很高。

详细而言,仅基在宏转录组的模子已经到达平均71%的正确率,整合多类证据后正确率可高达95%,媲美甚至优在当前单菌要领猜测模子等。于彻底自力的试验验证数据上,FUGAsseM依然到达80%的猜测正确率,显著优在依靠同源性的要领。

将FUGAsseM运用到人体肠道微生物组研究,团队取患了丰硕结果。

“咱们猜测出了44万多个基因家族的功效,此中82.3%此前未被表征。”张艳聪暗示,“更主要的是,咱们发明了3万多个全新的卵白家族,包括2.7万条弱同源性卵白家族及6000余条彻底无同源性的新型卵白家族。”

Huttenhower暗示,彻底无同源性的卵白家族的发明特别使人振奋。“这些卵白与已经知卵白没有序列相似性,咱们彻底经由过程它们的共表达模式猜测功效,这验证了循证推理模式的有用性。”

于这些新发明的卵白中,有些与人体康健紧密亲密相干。“咱们于益生菌Faecalibacterium prausnitzii中猜测到新型噬菌体防备。”张艳聪指出,这类益生菌于康健人体内品貌较高,而于疾病患者中较低,新发明的基因可能帮忙其抵御噬菌体侵染,维持肠道康健。

研究还有展现了年夜量此前未知的代谢与情况互作功效,包括铁离子稳态、氨代谢、毒素处置惩罚和宿主相干的跨膜转运功效等,为理解肠道菌群与宿主互作提供了新视角。

从东西到运用:多范畴潜力巨年夜

只管这项研究以肠道微生物组为运用案例,但FUGAsseM的设计具备广泛合用性。“它是一个很是具备广谱性的东西,不仅可以运用在人体微生物组,还有可以用在情况微生物组、农业中的根际微生物组或者泥土微生物组等。”张艳聪夸大。

审稿人对于这一东西赐与高度评价,认为“FUGAsseM可以或许精准解释人体微生物组中年夜量此前未知的‘暗物资’功效基因,与当前国际前沿研究标的目的高度契合,为深切理解微生物组功效提供了要害冲破。”

另外一位审稿人则奖饰“其代码质量极高,既便在初学者快速利用,也易在资深研究职员扩大与孝敬,表现了该东西的专业性与可连续性。”

张艳聪的研究履历自己就是一个跨学科的故事。北京师范年夜学博士卒业的她,最初专注在微生物进化生态学研究。

“我的博士事情是微生物进化生态,博士后阶段转向功效挖掘及机制解析。微生物组研究起首需要相识群落构成,但更主要的是解析它们于生态体系中的功效。”这一改变促使她开发新的研究东西。“传统要领没法猜测很多新基因的功效,这差遣咱们开发专门针对于群落中新型基因或者卵白功效猜测的东西。”张艳聪说。

FUGAsseM的呈现标记着微生物组研究正从描写性研究迈向智能化功效解析的新阶段。这一东西不仅为理解肠道菌群与宿主于免疫、代谢及疾病中的繁杂互作提供要害资源,也为展现情况微生物于营养轮回与生态均衡中的作用奠基要领学基础。

张艳聪暗示,跟着更大都据的堆集及东西的完美,他们将能更周全地解析微生物世界的功效暗码,这对于疾病研究、益生菌开发、情况功效猜测及农业生态调控都具备主要意义。

相干论文信息:https://doi.org/10.1038/s41587-025-02813-7

版权声明:凡三木SEO-本网注明“来历:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请于正文上方注明来历及作者,且不患上对于内容作本色性改动;微信公家号、头条号等新媒体平台,转载请接洽授权。邮箱:shouquan@stimes.cn。-米兰官网