2023NAR数据库特刊:单细胞数据库合辑

2023-02-20 1685文献解读

今年1月2023 Nucleic Acids Research Database Issue上线,包含178 篇涉及生物学和相关领域的论文:其中90篇论文报告了新数据库;82篇更新了该期先前发表的资源;6篇提供了最近在其他期刊发表的数据库的更新。

2023NAR特刊-单细胞数据库合辑

ABC Portal

2023NAR特刊-单细胞数据库合辑-1.png

ABC portal是ABC研究计划的重要组成部分,共计收录了国际上公开发表的198套人和小鼠的血液/免疫相关的单细胞转录组数据集,涉及文献150篇,涵盖了血液/免疫细胞的发育、分化和疾病相关的大量数据,数据来源覆盖了骨髓、外周血、胎肝等各种造血组织。为了方便用户对数据进行探索分析,所有数据都使用人工矫正后的单细胞参考数据进行了统一注释。

ABC portal提供基于网页的交互式分析模块,可进行基因表达、细胞比例、细胞相互作用和疾病相关的基因特征分析。特别是,ABC portal支持基于样本信息的个性化的样本筛选,细胞类型筛选,并对筛选后的数据进行进一步分析;支持跨数据集的比较分析。交互设计简洁易操作,分析内容多样,并且可以设置个性化参数以满足不同的数据分析目的。

数据库地址: http://abc.sklehabc.com

AgeAnno

2023NAR特刊-单细胞数据库合辑-2.png

AgeAnno是一个综合性的数据库,旨在通过使用scRNA-seq和scATAC-seq测序数据为人类不同组织细胞类型的衰老相关基因提供全面的特征。

当前版本的AgeAnno包含来自28个健康组织样本的1678610个细胞,年龄从0到110岁不等。开发团队从以往的资源中收集了5580个衰老相关基因,并对细胞环境进行了动态功能注释。对于scRNA-seq数据,开发团队进行了包括差异基因表达、基因变异系数、细胞通信网络、转录因子(TF)调节网络和免疫细胞比例的分析。AgeAnno还提供差异染色质可及性分析,motif/TF富集和足迹分析,以及scATAC-seq数据的共同可及性峰值分析。我们还提供针对衰老相关基因的疾病和药物。AgeAnno将成为系统表征人类不同组织细胞类型中衰老相关基因的独特资源,有助于抗衰老和衰老相关疾病的研究。

数据库地址:https://relab.xidian.edu.cn/AgeAnno/#/

HTCA

2023NAR特刊-单细胞数据库合辑-3.png

HTCA是一个基于web的交互式健康人类单细胞转录组图谱,包含19个成人组织及其匹配的胎儿组织,展示了跨组织的所有细胞类型的不同和深入的转录组图谱。HTCA也是一个单细胞剪接变异图谱,包含16个成人和胎儿组织的异构体表达谱。同时,HTCA作为一个多组学单细胞图谱,包含来自空间转录组的11个成人和胎儿组织的表型特征,以及来自scATAC-seq的27个成人和胎儿组织的表型特征。

HTCatlas提供了 9 种在线分析工具,供用户执行典型scRNA-seq分析中的主要步骤。通过提供对人类转录组谱的快速和简单的探索,旨在为世界各地的研究人员提供有价值的见解,以了解胎儿和成年人群组织中细胞类型的多组学概况。同时,图谱的广泛分析特征可以为研究人员快速识别自有单细胞数据中的表型特征提供一个快速而简单的解决方案。

数据库地址:https://www.htcatlas.org

HUSCH

2023NAR特刊-单细胞数据库合辑-4.png

Human Universal Single Cell Hub(HUSCH)是一个scRNA-seq数据库,用于分析和可视化不同组织中的人类基因表达。HUSCH数据库包括来自7个不同平台的45个人体组织的185个数据集。HUSCH中的所有数据均采用标准工作流程进行统一处理、注释和分析。

HUSCH为用户提供了两种探索路径:组织探索和数据集挖掘。在数据集模块中,HUSCH为每个细胞类型簇提供交互式基因表达可视化、差异表达分析、功能分析、转录调节因子预测和细胞间相互作用分析等。在组织模块中,HUSCH集成了不同的数据集,并进行了数据整合、批次校正和细胞类型统一,从而提供了基于来自多个来源和平台的单细胞数据集的组织内部基因表达可视化和分析。HUSCH提供了用户友好的探索界面,用户可以搜索、可视化、分析和下载人体组织图谱的单细胞基因表达。

数据库地址: http://husch.comp-genomics.org

SPEED

2023NAR特刊-单细胞数据库合辑-5.png

SPEED是一个覆盖127个物种的单细胞数据库,旨在更好地理解和利用所有目前已知的多个物种的 scRNA-seq 数据集,让研究界通过一个用户友好的界面免费访问关于跨物种进化、发育和疾病的单细胞数据。

SPEED分别在“Pan”、“Evo”、“Devo”和“Diz”模块中提供了关于泛物种、进化、发育和疾病的单细胞图谱。“C2C”、“G2G”和“S2S”三个分析模块允许探索细胞间通讯、基因间串扰和跨物种分子进化。最后四个功能模块“sSearch”、“sUp”、“sDown”和“sMarker”分别允许用户检索特定数据集、获取不同细胞类型的共同标记基因、自由上传和下载单细胞数据集。

数据库地址: http://speedatlas.net

CNGBdb时空组、单细胞数据库

STOmicsDB

2023NAR特刊-单细胞数据库合辑-6.png

STOMICS DataBase是一个与时空组学主题相关的综合平台,通过对公共数据库的6000多篇文献进行数据挖掘,联合时空数据汇交系统,策划了140个时空组学数据集,收录超1000张时空切片数据。

STOMICS DataBase提供一站式服务,包括:文献追踪→ 数据获取→ 可视化探索 → 在线分析 →  数据归档→ 时空专辑数据库发布,覆盖时空组学数据全生命周期。目前其已支撑Nature、Science、Cell在内的11篇文章发表,包括【时空组学联盟第一批生命发育时空图谱】覆盖小鼠、斑马鱼、果蝇、拟南芥四种模式生物胚胎或器官发育,【蝾螈脑再生时空图谱】等。

数据库地址:https://db.cngb.org/stomics/

CDCP

2023NAR特刊-单细胞数据库合辑-7.png

CDCP是一个单细胞数据集成、共享、分析的综合平台。其主要功能包括:1. 用户可以在线获取CDCP收录数据集中样本的详细信息,并允许下载每个单细胞数据集的原始序列和表达矩阵;2. 与UCSC单细胞浏览器和ASAP等其它平台不同,CDCP提供了一个共享和集成单细胞转录组学数据集平台,并允许用户上传数据,可以实时更新;3. CDCP允许使用tSNE细胞降维图、不同细胞类型的聚类分析图以及显示不同细胞类型数量的直方图对每个单细胞数据集进行可视化,其中多个基因在不同细胞类型或簇中的表达模式可通过聚类图和小提琴图显示。此外,CDCP还提供一个用户友好的分析流程,通过提供单细胞表达矩阵,用户可以在线对感兴趣的细胞数据集进行重新分析,包括数据质控、注释高度可变基因、降维/聚类、分析用于表征群体特征的标记基因等。

数据库地址: https://db.cngb.org/cdcp/

参考文献
[1] Gao,X., Hong,F., Hu,Z., Zhang,Z., Lei,Y., Li,X. and Cheng,T. (2022)ABC portal: a single-cell database and web server for blood cells.Nucleic Acids Res., https://doi.org/10.1093/nar/gkac646.
[2] Huang,K., Gong,H., Guan,J., Zhang,L., Hu,C., Zhao,W., Huang,L.,Zhang,W., Kim,P. and Zhou,X. (2022) AgeAnno: a knowledgebase ofsingle-cell annotation of aging in human. Nucleic Acids Res.,https://doi.org/10.1093/nar/gkac847.
[3] Pan,L., Shan,S., Tremmel,R., Li,W., Liao,Z., Shi,H., Chen,Q.,Zhang,X. and Li,X. (2022) HTCA: a database with an in-depthcharacterization of the single-cell human transcriptome.Nucleic Acids Res., https://doi.org/10.1093/nar/gkac791.
[4] Shi,X., Yu,Z., Ren,P., Dong,X., Ding,X., Song,J., Zhang,J., Li,T. andWang,C. (2022) HUSCH: an integrated single-cell transcriptomeatlas for human tissue gene expression visualization and analyses.Nucleic Acids Res., https://doi.org/10.1093/nar/gkac1001.
[5] Shi,X., Yu,Z., Ren,P., Dong,X., Ding,X., Song,J., Zhang,J., Li,T. andWang,C. (2022) HUSCH: an integrated single-cell transcriptomeatlas for human tissue gene expression visualization and analyses.Nucleic Acids Res., https://doi.org/10.1093/nar/gkac1001.
[6] Xu Z, Wang W, Yang T, et al. STOmicsDB: a database of Spatial Transcriptomic data[J]. bioRxiv, 2022.
[7] Li Y, Yang T, Lai T, et al. CDCP: A visualization and analyzing platform for single-cell datasets. J Genet Genomics. 2021 Dec 29:S1673-8527(21)00374-X.

上一篇下一篇