NC | MAGinator能够准确地分析种水平从头组装的MAGs

2024-08-05 67文献解读

宏基因组测序在表征微生物组方面具有巨大优势,但目前可用的分析工具缺乏将亚种级分类分辨率和准确丰度估算与组装基因组的功能分析相结合的能力。2024年7月,《Nature Communications》发表了一个专为分析鸟枪法宏基因组学数据集而定制的工具——MAGinator,提供亚种级微生物的从头鉴定和宏基因组组装基因组(MAG)的准确丰度估计。

MAGinator-1.png

MAGinator是什么?

MAGinator是一个专为分析鸟枪法宏基因组学数据集而定制的工具,其利用基于基因和contig方法提供的信息,产生对分类概况以及基因起源和遗传内容的见解,用于推断宿主生物体每个样本的功能信息。此外,MAGinator促进了MAGs之间系统发育关系的重建,提供了一个框架来识别进化水平的差异。

MAGinator-2.png

MAGinator将MAGs和原始reads作为输入,并产生输出,包括准确的丰度估计、亚种水平的系统发育和基因同源簇,可以提高对微生物组组成的认识。由于MAGinator依赖于contig组装和MAGs的质量,开发团队通过将MAGs分为以比物种更高的分辨率在系统发育上分离的簇,并估计这些簇的丰度来实现这一点:这是通过直接从给定数据中识别一组特征基因,并根据统计建模对其进行细化,以选择适合丰度估计的理想基因集来实现的。

MAGinator的性能测试

开发团队在CAMI数据集上证明了MAGinator估计丰度的准确性,并将MAGinator与类似工具进行了比较。

使用OPAL基准测试比较CAMI strain-madness数据集的分类分析结果;MAGinator可以准确检测模拟数据中的菌株。

MAGinator-3.png

开发团队还在炎症性肠病(IBD)患者的公共数据集上展示了 MAGinator 的功能:MAGinator以较高的系统发育分辨率识别了患者和对照组之间不同的丰度类群。MAGinator 改进了对差异丰度生物的检测:IBD病例研究显示,MAGinator的性能与β多样性相似,DA分析也有所改善。

MAGinator-4.png

MAGinator 还能够从特征基因中创建单核苷酸变异 (SNV) 分辨率系统发育树。它们用于对 MAGs进行额外的分层,并可与元数据关联以获取亚种级差异。开发团队展示了MAGinator从两个真实世界的婴儿数据集中获得婴儿双歧杆菌亚种级分辨率的能力。在这种情况下,在一个数据集中从头发现了特征基因,然后利用它们在另一个队列中获得亚种级分辨率。MAGinator 支持跨数据集追踪亚种:利用来自 MAGinator 聚类 1 的长双歧杆菌亚种的相对丰度对 StrainPhlAn 聚类进行分层,表明长双歧杆菌亚种为 B。

MAGinator-5.png

MAGinator基因分析的一个关键优势是,根据定义,每个蛋白质簇都可以链接到编码它的宿主MAGs。这使得能够发现蛋白质-宿主与样本表型的相互作用,连接分类和功能分析。开发团队用COPSAC2010 cohort验证了MAGinator识别de novo基因协同簇帮助功能研究。

MAGinator可在GitHub上获得: https://github.com/Russel88/MAGinator

参考文献:Zachariasen, T., Russel, J., Petersen, C. et al. MAGinator enables accurate profiling of de novo MAGs with strain-level phylogenies. Nat Commun 15, 5734 (2024). https://doi.org/10.1038/s41467-024-49958-8

上一篇下一篇