2020-10-10 7891文献解读
癌症仍然是人类遗传学家感兴趣的一个关键领域,其中TCGA代表了癌症基因组的一个重大进展,其提供了主要癌症类型中发生的关键基因组变化的全面目录,这些数据有助于更有效的癌症诊断、治疗和预防研究。为了便于数据挖掘,已经开发了多种针对TCGA的分析工具。这么多工具我们应该如何有效使用?今天分享的综述可以给出答案。
来自北京放射医学研究所的研究人员在《Briefings in Bioinformatics》杂志发表了基于Web的TCGA数据分析工具/数据库的研究与评价。研究团队详细介绍了公开在线分析工具及其分类,并根据不同类型的癌症研究提出了工具选择和优先次序的一般建议。
研究团队列出了一个详尽的基于Web的TCGA数据分析工具列表,并按照分析要求把工具分为三大类:全局分析、靶标分析、辅助分析。
全局分析:允许用户检查癌症基因组的整体特征,对于刚刚开始研究癌症基因组数据的研究人员来说,这是一个宝贵的资源。分析工具包括Broad GDAC Firehose、Cancer Landscapes、canEvolve、Regulome Explorer、TCGA Mbatch、TCGA Next-Generation Clustered Heatmaps、The Cancer Proteome Atlas、MethHC、Omics Analysis System for Precision Oncology、OncoScape、TCGA Clinical Explorer、TCGA SpliceSeq。
靶标分析:是研究人员最常使用的基于web的工具类别。这些工具允许研究人员通过对基因和miRNAs的深入分析来研究感兴趣的靶标。分析工具包括Cancer3D、cBioPortal、Gene Expression Profiling Interactive Analysis、IntOGen、KMplotter、MEXPRESS、PROGgeneV2、TANRIC、TCGA4U、UALCAN、UCSC Xena、Wanderer、Zodiac。
辅助分析:是基于公共Web的工具将TCGA数据转换为易于访问,浏览和下载的在线资源。这些数据可以帮助用户补充他们的实验结果,或者可以为全面的生物学发现提供额外的证据和解释。分析工具包括BCMD、CDSA、Cell Index Database、Gene–Drug Interaction for Survival in Cancer、PathwayMapper、TCIA、Vanno。
变异分析:有10个在线工具(Broad GDAC Firehose, Cancer3D, cbioportal, CELLX, IntOGen, TANRIC, TCGA Clinical Explorer,TCGA4U, UCSC Xena 和 Vanno)可以执行突变分析。一般来说,我们推荐cbioportal,因为这个工具包含多种癌症类型和多种可视化效果,其功能强大而且使用起来很方便。
相关性分析:有17个在线工具(Broad GDAC Firehose, Cancer Landscapes, canEvolve, cbioportal, CELLX, GDISC, GEPIA, MethHC, MEXPRESS, OASISPRO, Regulome Explorer, TANRIC, TCGA Clinical Explorer, TCGA NG-CHM, TCPA, Wanderer 和 Zodiac)可以进行相关性分析。总的来说,我们推荐Broad GDAC Firehose,它有多种分析算法可供用户使用。
差异分析:有12个在线工具(Broad GDAC Firehose, canEvolve,cbioportal, CELLX, GEPIA, MEXPRESS, OncoScape, TANRIC,TCGA4U, TCPA, UALCAN 和 Wanderer),可以执行差异分析。一般来说,我们推荐GEPIA,一种基因表达谱分析工具。(目前该工具已升级至GEPIA2。使用攻略:神器GEPIA2在手,不会编程也能轻松挖掘TCGA)
通路分析:有8个在线工具(Broad GDAC Firehose, Cancer Landscapes, canEvolve, MethHC, OncoScape, PathwayMapper,Regulome Explorer 和 TCGA NG-CHM),可以执行通路分析。我们建议使用Broad GDAC Firehose和OncoScape,前者具有多种分析方法,而后者则更加简单直观。
生存分析:有16个在线工具(Broad GDAC Firehose, Cancer Landscapes, canEvolve, cbioportal, CELLX, GDISC, GEPIA, KMplotter, OASISPRO, PROGgeneV2, TANRIC, TCGA Clinical Explorer, TCGA4U, TCPA, UALCAN 和UCSC Xena)可以执行生存分析。如果用户想要执行这个单一的分析,我们推荐PROGgeneV2,它有广泛的数据源和可调整的生存分析参数。
泛癌分析:有8种在线工具(Broad GDAC Firehose, Cancer Landscapes, cbioportal, IntOGen, Regulome Explorer, TCGA NGCHM, UCSC Xena 和 Zodiac)可以执行泛癌症分析。一般来说,我们推荐cbioportal和Cancer Landscapes。前者拥有大量泛癌研究样本和强大的分析能力,后者可结合泛癌模型进行分析。
From 研究团队: 虽然我们全面地整理和总结了基于web的资源和工具,然而这些工具都不能完全取代先进的计算和统计方法。此外,癌症研究人员仍然有责任了解大量数据并将其转化为可检验的假设以及针对临床的创新诊断和治疗选择。为此,我们希望当前的调查能够为研究人员提供所需的信心,以扩展他们目前对癌症基因组学及其复杂细节和网络的了解,从而确定新的癌症治疗和预防方法和靶标。
小编有话说:关于TCGA的数据分析工具/数据库更新较快,鉴于本文的发表时间(2018年),新的工具/数据库未包含在内或者有升级,欢迎大家在公众号后台直接留言#你觉得好用的TCGA数据挖掘工具#
参考文献
Zhang Z, Li H, Jiang S, et al. A survey and evaluation of Web-based tools/databases for variant analysis of TCGA data[J]. Briefings in bioinformatics, 2019, 20(4): 1524-1541.
图片来源:Briefings in bioinformatics和参考文献,如有侵权请联系删除。