2020-10-09 5804其它数据库
不论是做基础研究还是临床研究,TCGA都是“宝藏”数据库,可是不会写代码,如何徒手挖掘TCGA?
来自北京大学的研究人员开发了GEPIA,GEPIA让没有任何编程背景的科研工作者能够轻松执行各种基因表达分析。其相关研究成果已发表在《Nucleic Acids Research》。
GEPIA(Gene Expression Profiling Interactive Analysis)web工具于2017年首次发布,基于TCGA和GTEx数据库中的肿瘤和正常样本进行基因表达分析。截至2019年5月,根据Google学术搜索的统计数据,GEPIA已被引用414次,并处理了来自全球约11万个不同IP地址的约40万个分析请求。2019年研究团队推出了更高分辨率和更多功能的加强版GEPIA2。
GEPIA2为用户提供公共数据分析和自有数据分析两大块功能。
用户可以使用GEPIA2的相关模块完成基于TCGA和GTEx数据的基因表达的一般性分析、差异表达分析、表达DIY、生存分析、Isoform分析、相关性分析、基因相似性分析、PCA分析。
在输入框中输入目标基因名称,即可得到该基因在不同组织中正常和癌症中的表达交互人体图、散点图、柱状图以及异构体/相似基因列表。
设置搜索条件:选择癌症类型,筛选差异的阈值和差异表达的方法。点击plot可得到差异基因的不同染色体分布;点击list得到差异基因列表。
对同一个基因不同转录本的表达做分析,得到不同转录本的表达丰度及Isoform结构。
输入基因或基因标签名称,选择癌种/样本信息,即可完成基因相关性、相似性、PCA分析。
用户可上传自有数据,完成癌症亚型分类及基因表达分析。
本地程序包:GEPIA2 提供了一个python程序包供快速分析和检索
首页功能分类模块:用户也可以在此模块选择相关分析功能(单基因分析、癌症类型分析、自有数据分析、多基因分析)。
Dataset Sources:提供了GEPIA2中可用的TCGA/GTEx数据的概述,包括组织样本、基因分类、Isoform和癌症亚型。
GEPIA2访问地址:http://gepia2.cancer-pku.cn/
参考文献
[1] Tang Z, Li C, Kang B, et al. GEPIA: a web server for cancer and normal gene expression profiling and interactive analyses[J]. Nucleic acids research, 2017, 45(W1): W98-W102.
[2] Tang Z, Kang B, Li C, et al. GEPIA2: an enhanced web server for large-scale expression profiling and interactive analysis[J]. Nucleic acids research, 2019, 47(W1): W556-W560.
图片来源于GEPIA2和参考文献,如有侵权请联系删除。