2019-05-27 5045文献解读
5月22日,来自深圳华大生命科学研究院和国家基因库的研究人员在国际著名期刊《Nucleic Acids Research》上发布了一个全新的噬菌体捕获工具:Prophage Hunter。
Prophage Hunter提供了一种从细菌基因组提取原噬菌体基因组的一站式web服务,可用于评估噬菌体的活性、鉴定亲缘关系近的噬菌体、并注释噬菌体的蛋白功能。
与超过19.9万个细菌基因组相比,截至2019年4月26日,NCBI基因组中只有不到1.1万个噬菌体基因组。传统噬菌体信息主要来源于从自然界中分离的噬菌体,这样的获取方式不仅存在随机性,而且由于一些细菌生长条件的特殊性限制,部分噬菌体信息难以获取,而高通量测序技术的发展有助于解决以上问题。目前有几种工具可以从细菌高通量测序数据中预测噬菌体序列,包括MARVEL、VirFinder、PHASTER、MetaPhinder、VirSorter、PhiSpy。
其中只有PHASTER预测了原噬菌体区域的完整性,但也只是简单的将核酸、总基因、必需基因和噬菌体类似基因的数量的分数相加,忽略了原噬菌体在细菌细胞内可能经历的突变事件。此外,所有基于数据库的预测工具均只识别与其数据库记录类似度最高的噬菌体。
Prophage Hunter整合了基于序列相似性的比对以及基于遗传特征的机器学习分类,旨在对原噬菌体是否具备活性进行打分。同时,Prophage Hunter用户可选跳过基于序列相似性的比对,这样就增加了发现新噬菌体的概率。Prophage Hunter仍然如文中所述在几个方面存在改善空间,但目前在预测活性噬菌体方面比现有工具具备更高精度。
运用Prophage Hunter,我们可以充分利用不断增长的细菌高通量测序数据来挖掘原噬菌体信息。预测原噬菌体是否具备活性有助于研究细菌和噬菌体共进化、噬菌体生理特性、寻找包括新型CRISPR系统在内的细菌防御系统、定制合成噬菌体用于治疗疾病等。
Prophage Hunter希望可以吸引来自基因组学、微生物学、合成生物学和其他相关领域的广泛用户,并促进这些领域的研究。本次研究中Prophage Hunter临床案例研究中分离得到的K. pneumoniae KP6512、A. baumannii AB8929和原噬菌体序列均保存在了国家基因库生命大数据平台(CNGBdb),项目编号:CNP0000380 。
审核:宋文琛
参考文献:Wenchen Song,Hai-Xi Sun,Carolyn Zhang,et al.Prophage Hunter: an integrative hunting tool for active prophages[J].Nucleic Acids Research, gkz380, https://doi.org/10.1093/nar/gkz380