单细胞数据库推荐 | TEDD:人和模式动物组织器官发育单细胞转录组与染色质可及性数据库

2022-11-17 63CNGBdb

近日,香港中文大学和深圳华大生命科学研究院团队合作在Nucleic Acids Research杂志发表了一个全新的人和模式动物组织器官发育单细胞转录组与染色质可及性数据库:TEDD(Temporal Expression during Development Database)。

TEDD-1.png

TEDD

TEDD-2.png

TEDD系统地整合了现阶段最新、最全的单细胞组学数据资源:来自人与多种模式动物(小鼠、斑马鱼、线虫等)的2760个样本的RNA测序数据,以及510万个单细胞测序数据(单细胞RNA-seq和单细胞ATAC-seq);

同时,TEDD提供用户友好的交互式分析工具,供研究人员分析和可视化跨组织及不同发育期的基因表达、调控和网络:1)使研究人员能够了解细胞类型、组织类型和时间点特异性表达模式的差异,以及所查询基因在单细胞水平上的染色质可及性特征;2)提供一个集成网络以识别在不同细胞类型、时间点和性别条件下目标基因共表达的细胞;3)分析和聚类基因的表达模式,特别是研究来源于相同GO或KEGG下的多基因的表达互作;和4)在所选细胞类型、组织类型和时间点上鉴定具有与查询基因相似或不同表达谱的基因。

TEDD不仅使研究人员能够识别细胞类型/组织类型的特定和时间性的基因表达和染色质谱,还有利于将发育和疾病中未确定生物功能的基因联系起来,有效促进人类疾病和发育生物学的遗传研究。

为什么要搭建TEDD?

细胞命运决定(cell fate decision)在多细胞生物从合子到功能分化的细胞类型、组织和器官的发育过程中起着非常重要的作用。人和其它哺乳动物的每个发育阶段都涉及复杂的增殖、分化和重编程等细胞分化过程。近年来,单细胞和时空多组学技术的快速发展,使得深入理解模式动物及人组织器官的发育过程中细胞分化与基因动态调控成为可能。随着单细胞测序研究数量的急剧增加,尽管已开发多种单细胞组学数据库(如HCA、MCA、CDCP等),但目前仍缺乏一个参考数据库,覆盖模式动物和人生命发育周期最新和最全的数据集,以应对数据挖掘和再分析面临的挑战。基于此,香港中文大学和深圳华大生命科学研究院团队合作开发TEDD。

TEDD有哪些主要功能?

TEDD-3.png

用户通过TEDD导航栏子菜单引导即可进入相应功能页面,其主要功能如下:

以UMAP展示基因表达与染色质可及性

为了更好地展示数据,在输入参数(物种、组织类型和查询基因等)后,TEDD按照细胞类型、组织类型、时间点以及性别4种不同要素标记UMAP中的细胞,用户亦可手动去除某一或某些标记(如细胞类型)仅保留其感兴趣的部分,基因表达或染色质可及性以热图形式展示。为了便于比较,TEDD还可在同一界面展示两个查询结果。

共表达分析

在以往研究中科研人员较难确认具有多基因共同表达的细胞类型与表达比例。TEDD解决了这一难题,其提供了细胞类型、时间点以及性别3种不同要素下,共表达多个目标基因的细胞类型以及比例,供研究者挑选下一步实验的对象。

多基因表达趋势聚类分析

在选择参数(物种、组织类型、细胞类型和时间点等)后,TEDD提供多基因列表进行表达聚类,用户也可查询目标基因所在的GO和KEGG通路获取该通路所包含的基因列表进行表达聚类。

时序性特异表达基因查找

TEDD提供同一组织类型、不同时间节点中存在显著差异表达的基因;也可选择不同组织类型、细胞类型和时间节点后,在自定义差异倍数变化及最大输出基因个数的情况下,查找与已检测到差异表达基因存在相同或不同表达趋势的基因列表,供研究人员进一步探索不同基因之间的调控关系。此外,TEDD提供时序性稳定表达基因查找功能。

多细胞RNA表达量查询

由于单细胞实验过程中可能存在因实验原因导致细胞丢失的情况,TEDD包含多细胞RNA测序分析结果(含不同组织类型、时间节点等),供研究人员查询目标基因的表达量。

总之,TEDD为研究人员提供在单一、多个以及无目标基因的情况下,不同目标基因的组织类型、细胞类型或时间点特异性的表达与染色质可及性频谱,为进一步破译与发育/疾病相关的未知生物学功能基因提供研究基础。

TEDD:https://TEDD.obg.cuhk.edu.hk/

本研究的顺利开展得到了香港健康与医学研究基金(#08190226, #09200236)、香港合作研究基金(#C4062-21GF)和广东省基因组学数据中心(#2021B1212100001)建设项目等经费的支持。

参考文献Ziheng Zhou, Cong Tan, Matthew Hoi Kin Chau, Xiaosen Jiang, Ziyuan Ke, Xiaoyan Chen, Ye Cao, Yvonne K Kwok, Matthew Bellgard, Tak Yeung Leung, Kwong Wai Choy, Zirui Dong, TEDD: a database of temporal gene expression patterns during multiple developmental periods in human and model organisms, Nucleic Acids Research, 2022;,gkac978, https://doi.org/10.1093/nar/gkac978
信息来源:“BioArtMED”公众号
图片来源:TEDD官网和参考文献

上一篇下一篇

相关专题