关注官方微信平台

电话:400-664-9912

QQ:3003443147

邮箱:marketing@biotree.cn

地址:上海市嘉定区新培路51号焦点梦想园B栋5楼

上海阿趣生物科技有限公司. 版权所有 沪ICP备17019578号-1

深度解读 | MetDNA:基于代谢反应网络的大规模代谢物注释新算法

分类:
阿趣动态
发布时间:
2019/04/04 17:49
浏览量
 
1
引言
 
众所周知,做非靶向代谢的人分为两种:有钱,RICH,疯狂买标准品建二级谱图库;没钱,到处找二级谱图库。
 
他们的共同点就是非常关心标准二级谱图库,天天想着把自己的二级谱图库变大一点,再变大一点。
 
2019年4月3日,我们合作伙伴中国科学院上海有机化学研究所生物与化学交叉研究中心朱正江研究员课题组发表了一个递归式外延标准二级谱图库的方法:metabolic reaction network (MRN)-based recursive algorithm (MetDNA)。 1
 
代谢组学
 
2
概要
 
这个方法的主要思路是:利用KEGG提供的(代谢物)反应对(RP,reaction pair)构建网络,对标准二级谱图库进行递归式的二级谱图外延。
 
3
原理详解
 
获取反应对RP
 
直接在KEGG网站https://www.kegg.jp/获取。 反应对的记录格式为:Cxxxxx_Cxxxxx。两端为代谢物的KEGG ID,中间使用下划线连接。MetDNA共计获取了9603个反应对RP和7639个代谢物。( 推荐阅读这篇文章:Data, information, knowledge and principle: back to metabolism in KEGG2
 
代谢组学
 
图1 KEGG中记录的反应对
 
小提示:反应对RP两端的代谢物结构是相似的。
 
代谢物反应网络MRN构建
 
按照反应对记录格式,提取两端代谢物信息,即可生成代谢物反应网络MRN。网络的可视化可以使用Cytoscape https://cytoscape.org/完成。
 
代谢组学
 
图2 代谢物反应网络MRN构建
 
基于代谢物反应网络MRN进行二级谱图外延的依据
 
一般的结构相似的代谢物的二级谱图相似性会相对高一些。前面我们提到过反映对两端的代谢物结构是相似的。同时,反应的存在对结构相似的代谢物做了进一步限制。在自建库、METLIN库和NIST库中在代谢物反应网络MRN中相邻的代谢物(即属于同一反应对RP)的二级谱图相似性大于等于0.5的数量超过了50%。
 
代谢组学
图3 MRN相邻代谢物RP二级谱图相似1
 
代谢组学
图4 MRN相邻代谢物RP二级谱图相似2
 
递归式二级谱图外延实现
 
第一轮匹配
 
首先,对于代谢物反应网络MRN的一部分物质需要有标准二级谱图,称为种子库。使用种子库我们可以完成一部分实验二级谱图的匹配(知道对应那些标准二级谱图了)。匹配算法同时考虑:母离子m/z、色谱保留时间RT和二级谱图。
 
第一轮外延
 
根据第一轮匹配结果,将第一轮匹配到标准二级谱图的实验二级谱图作为标准二级谱图外延给其在代谢物网络中相邻代谢物。同时,根据相邻代谢物的物质信息推测其母离子m/z,色谱保留时间RT,以实现区分同一已匹配代谢物的不同相邻代谢物。
 
代谢组学
图5 二级谱图的递归式外延
 
第二轮匹配
 
将第一轮外延的二级谱图作为种子库,对第一轮未匹配上的实验二级谱图进行第二轮匹配。
 
第二轮外延
 
根据第二轮匹配结果,将第二轮匹配到标准二级谱图的实验二级谱图作为标准二级谱图外延给其在代谢物网络中相邻代谢物。同时,根据相邻代谢物的物质信息推测其母离子m/z,色谱保留时间RT,以实现区分同一已匹配代谢物的不同相邻代谢物。
 
…递归…
 
随着二级谱图的外延,匹配(注释)数逐渐放缓增长,即可终止递归。
 
代谢组学
图6 递归外延
 
代谢组学
图7 递归终止
 
注释质量评估
 
正负离子模式共计注释代谢物数量接近2000。TOP3的注释正确率达到77.5%。TOP3的注释正确率意为:对未知代谢物给出的前三可能性的候选注释中存在正确注释的概率。
 
代谢组学
图8 注释质量评估
 
4
小声议论
 
结果评估中提到的CFM-ID http://cfmid.wishartlab.com/ 是一个根据结构预测二级谱图进行代谢物注释的工具。3 4 除此之外,还有基于结构相似来进行二级谱图外延的LipidBlast、PlantMAT、FlavonoidSerch,基于结构来进行谱图预测的CSI: FingerID、MS-FINDER、MetFrag等工具用于改善标准二级谱图库不足限制未知代谢物注释的问题。而MetDNA有其独特的创新性及技术优势。
 
圈重点:
1.使用MetDNA能鉴定出约2,000个代谢物;
2.准确性优于CFM-ID,TOP3准确性达77.5%;
3.MetDNA实现了小库当大库使,性价比贼高!
 
5
文章延伸
 
2014年,上海百趣生物医学科技有限公司与中国科学院生物与化学交叉研究中心达成产学研战略合作。本文通讯作者朱正江研究员作为百趣生物特聘技术专家顾问,多年来一直为百趣生物提供强有力的技术支撑,促进了百趣生物和代谢组学行业的发展,有需要metDNA检测分析服务的老师,欢迎垂询服务热线:400-664-9912。
 
参考文献:
1.Y. Yin, Y. Cai, Z. Ma, N. Liu, and Z.-J. Zhu. Metabolic Reaction Network-based Recursive Metabolite Annotation for Untargeted Metabolomics. X. Shen, R. Wang, X. Xiong, Nature Communications, 2019, 10: 1516. doi:10.1038/s41467-019-09550-x.
2.Kanehisa, M., Goto, S., Sato, Y., Kawashima, M., Furumichi, M., & Tanabe, M. (2013). Data, information, knowledge and principle: back to metabolism in KEGG. Nucleic acids research, 42(Database issue), D199–D205. doi:10.1093/nar/gkt1076.
3.Allen F, Greiner R, and Wishart D. Competitive fragmentation modeling of ESI-MS/MS spectra for putative metabolite identification. Metabolomics. June 2014.
4.Allen F, Pon A, Wilson M, Greiner R, and Wishart D. CFM-ID: a web server for annotation, spectrum prediction and metabolite identification from tandem mass spectra. Nucleic Acids Res. June 2014.
 
代谢组学
>
>
>
>
深度解读 | MetDNA:基于代谢反应网络的大规模代谢物注释新算法