4月3号,朱正江老师在《nature communications》杂志上发表了基于代谢反应网络(MRN)的递归算法(MetDNA)。这种算法适用于任何LC-MS平台,任何数据采集模式,在一次实验中能够成功注释超过2000种代谢物(此处应该有掌声!)。
Metabolic reaction network-based recursive metabolite annotation for untargeted metabolomics
原文链接:
https://www.nature.com/articles/s41467-019-09550-x
代谢物的注释是代谢组学实验的一大难点,依赖于标准品二级谱图数据库, HMDB、Metlin数据库中90%的已知代谢物都没有标准的二级谱图,并且许多胞内代谢物缺乏标准品,也阻碍了现有数据库的扩大。代谢物的二级谱图与LC-MS仪器、实验室条件有关,也导致目前还没有一个标准的数据库构建协议。
基于代谢反应网络的递归算法,朱正江老师开发了MetDNA软件,显著增加了代谢物的注释数量。其基本原理是:在细胞环境中,一种代谢物可以被催化成另一种代谢物产物。因此将底物代谢物与其相似化学结构的产物代谢物定义为一对反应对(RP)。特别是在串联MS中,代谢物的碎裂模式由其化学结构决定。由于它们的结构相似性,反应配对的两种代谢物倾向于具有相似的MS2谱。因此,原则上MetDNA可以使用反应对中的一个代谢物来注释另一个未知代谢物,而不一定通过标准品谱图数据库中现有的MS2来注释。
更重要的是,通过递归算法重复应用该策略可逐步扩展注释代谢物。数据显示,在一个实验中,MetDNA显着增加了代谢物的注释数量,从传统分析的不到100种代谢物增加到超过2000种代谢物。 MetDNA还包括一个自我检查的打分系统,可以减少冗余和不确定性。
总而言之,即使标准品数据库不全,MetDNA也可以对非靶向代谢组学数据进行大规模的代谢物注释。毫无疑问,朱老师的这篇文章给从事代谢组学研究的广大同行打了一剂强心针,让我们看到了解决代谢组学定性难题的希望和出路所在。