神器GEPIA2在手,不会编程也能轻松挖掘TCGA | 癌症研究数据库推荐

2020-10-09 6008其它数据库

不论是做基础研究还是临床研究,TCGA都是“宝藏”数据库,可是不会写代码,如何徒手挖掘TCGA?

来自北京大学的研究人员开发了GEPIA,GEPIA让没有任何编程背景的科研工作者能够轻松执行各种基因表达分析。其相关研究成果已发表在《Nucleic Acids Research》。

GEPIA2-1.png

GEPIA(Gene Expression Profiling Interactive Analysis)web工具于2017年首次发布,基于TCGA和GTEx数据库中的肿瘤和正常样本进行基因表达分析。截至2019年5月,根据Google学术搜索的统计数据,GEPIA已被引用414次,并处理了来自全球约11万个不同IP地址的约40万个分析请求。2019年研究团队推出了更高分辨率和更多功能的加强版GEPIA2。

如何使用GEPIA2?

GEPIA2为用户提供公共数据分析和自有数据分析两大块功能。

公共数据分析

GEPIA2-2.png

用户可以使用GEPIA2的相关模块完成基于TCGA和GTEx数据的基因表达的一般性分析、差异表达分析、表达DIY、生存分析、Isoform分析、相关性分析、基因相似性分析、PCA分析。

基因表达的一般性分析

在输入框中输入目标基因名称,即可得到该基因在不同组织中正常和癌症中的表达交互人体图、散点图、柱状图以及异构体/相似基因列表。

GEPIA2-3.png

差异表达分析

设置搜索条件:选择癌症类型,筛选差异的阈值和差异表达的方法。点击plot可得到差异基因的不同染色体分布;点击list得到差异基因列表。

GEPIA2-4.png

表达DIY

  1. 目的基因表达量分析
  2. 特定基因的特定癌种的正常组织对比肿瘤组织的表达分析
  3. 特定基因在特定癌种中的不同病理分期中的表达差异分析
  4. 多个目标基因的表达分析

GEPIA2-5.png

生存分析

  1. 对特定基因的生存分析
  2. 对特定病种里所有与预后差异显著相关的基因的汇总(适合找课题)
  3. 多个基因在多个癌症中与生存的关联分析

GEPIA2-6.png

Isoform分析

对同一个基因不同转录本的表达做分析,得到不同转录本的表达丰度及Isoform结构。

GEPIA2-7.png

基因相关性、相似性、PCA分析

输入基因或基因标签名称,选择癌种/样本信息,即可完成基因相关性、相似性、PCA分析。

GEPIA2-8.png

自有数据分析

GEPIA2-9.png

用户可上传自有数据,完成癌症亚型分类及基因表达分析。

GEPIA2-10.png

本地程序包:GEPIA2 提供了一个python程序包供快速分析和检索

GEPIA2-11.png

首页功能分类模块:用户也可以在此模块选择相关分析功能(单基因分析、癌症类型分析、自有数据分析、多基因分析)。

GEPIA2-12.png

Dataset Sources:提供了GEPIA2中可用的TCGA/GTEx数据的概述,包括组织样本、基因分类、Isoform和癌症亚型。

GEPIA2-13.png

GEPIA2访问地址:http://gepia2.cancer-pku.cn/

参考文献
[1] Tang Z, Li C, Kang B, et al. GEPIA: a web server for cancer and normal gene expression profiling and interactive analyses[J]. Nucleic acids research, 2017, 45(W1): W98-W102.
[2] Tang Z, Kang B, Li C, et al. GEPIA2: an enhanced web server for large-scale expression profiling and interactive analysis[J]. Nucleic acids research, 2019, 47(W1): W556-W560.
图片来源于GEPIA2和参考文献,如有侵权请联系删除。

上一篇下一篇

相关专题