2020-09-01 4060其它数据库
做病毒组分析的时候用什么库做比对?NCBI病毒参考序列数据库、ACLAME、自建库....现在,你又多了一个选择
2020年8月24,来自美国的科学家在Cell子刊《Cell Host & Microbe》发表了人类肠道病毒组数据库(GVD),填补了肠道病毒组分析标准的“空白”,为以病毒组为中心的健康和疾病研究提供标准化的数据资源。
大家对人类肠道微生物组的研究热度一直很高,病毒作为肠道微生物群的组成部分对于人类健康和疾病也发挥着重要作用。新的研究表明,肠道病毒组通过与共生菌群的多种相互作用途径,甚至直接与人类免疫系统成分相互作用,在稳态调节和疾病进展中发挥着重要作用。
然而,病毒组的研究由于参考数据库的局限性,常常被忽略。与细菌16SrRNA不同,病毒缺乏通用标记,人类肠道病毒组的研究通常使用BLAST或Kraken对NCBI病毒参考序列数据库、ACLAME或自建库进行序列同源比对。虽然现在有一套病毒识别工具,包括DeepVirFinder、mavel、VIBRANT和VirSorter,但迄今为止,只有后者被用于人类肠道微生物组学文献中,并且在某种程度上都依赖于参考基因组数据库。
因此,研究团队整理和汇总了已有的人类肠道病毒组研究数据构建GVD,使用它来评估研究偏差和全球生态模式,并展示了病毒在人类生命周期中是如何进化的。
研究团队收集并整理了2697个先前对病毒进行过研究的人类肠道宏基因组数据,建立人类肠道病毒数据库(GVD)。GVD的2697个人类肠道宏基因组数据集来自32个研究,涵盖了16个国家的1986例个体。
GVD包含57,605个contigs和33,242个病毒种群,大部分是噬菌体(占GVD的97.7%)。迄今为止,GVD包含的病毒RefSeq中的全部噬菌体分离物比整个培养噬菌体分离物多12倍。因此,GVD极大地增强了人类肠道中已知噬菌体的功能。
为了评估GVD的效用,研究团队通过比较GVD、NCBI的病毒RefSeq v96、DOE的IMG/ VR v4和每个研究的单个病毒组数据库中可识别的病毒种群数量,定量评估了多个数据库之间的病毒识别敏感性。研究表明:GVD显著改进了当前病毒基因组数据库的病毒检测,平均病毒检测率比RefSeq和IMG/VR分别提高了近182倍和2.6倍。
跨研究分析显示,病毒人群水平存在强烈的研究偏倚。
与VLP(病毒样颗粒)基因组相比,大体积基因组更容易制备,并且具有更高的病毒检测率,因此,大体积基因组可能是未来研究的最佳选择。
健康的西方人肠道病毒的多样性取决于年龄:在健康的西方个体中,年龄影响肠道内病毒的多样性,这种多样性从儿童期到成年期显著增加,在65岁以后又减少。这种模式与已知的肠道细菌多样性的消长规律相吻合,只有一个例外:免疫系统发育不全的婴儿肠道内充满了各种病毒类型,但细菌种类很少。
可通过以下DOI链接直接从iVirus下载GVD病毒种群和所有IV数据库:https://doi.org/10.25739/12sq-k039.
本研究中使用的脚本可通过如下链接获取:https://www.biomart.cn/v3/webinars/index.
原始数据可通过Table S1中的数据编号在SRA、iVirus或MG-RAST获取。
参考文献
Gregory A C, Zablocki O, Zayed A A, et al. The Gut Virome Database Reveals Age-Dependent Patterns of Virome Diversity in the Human Gut[J]. Cell Host & Microbe, 2020.
图片来源:参考文献,如有侵权请联系删除。