JGG | 国家基因库发表单细胞数据递交和可视化平台

2022-03-08 1322CNGBdb

2021年12月29日,Journal of Genetics and Genomics 在线发表国家基因库生命大数据平台团队和深圳华大生命科学研究院精准健康研究所和超级细胞所团队合作题为“CDCP: a visualization and analyzing platform for single-cell datasets”的研究论文。该论文介绍了单细胞数据可视化分析平台CDCP可提供全面的单细胞数据资源和便捷的可视化在线分析工具。

CDCP-1.png

CDCP的主要功能

CDCP是一个单细胞数据集成、共享、分析的综合平台。其主要功能包括:1. 用户可以在线获取CDCP收录数据集中样本的详细信息,并允许下载每个单细胞数据集的原始序列和表达矩阵;2. 与UCSC单细胞浏览器和ASAP等其它平台不同,CDCP提供了一个共享和集成单细胞转录组学数据集平台,并允许用户上传数据,可以实时更新;3. CDCP允许使用tSNE细胞降维图、不同细胞类型的聚类分析图以及显示不同细胞类型数量的直方图对每个单细胞数据集进行可视化,其中多个基因在不同细胞类型或簇中的表达模式可通过聚类图和小提琴图显示。此外,CDCP还提供一个用户友好的分析流程,通过提供单细胞表达矩阵,用户可以在线对感兴趣的细胞数据集进行重新分析,包括数据质控、注释高度可变基因、降维/聚类、分析用于表征群体特征的标记基因等。

CDCP-2.png

深圳华大生命科学研究院李月娇和邱嘉颖,深圳国家基因库杨涛、赖婷婷、游丽金、杨帆为该论文共同第一作者,深圳国家基因库魏晓锋、陈凤珍和深圳华大生命科学研究院刘龙奇博士为共同通讯作者。

使用CDCP完成单细胞数据存储

用户可根据“Submission”页面的操作指引存储单细胞测序数据、表达矩阵、MM坐标矩阵、聚类文件等。

CDCP-3.png

单细胞实验/测序数据

单细胞实验/测序数据包括单细胞组学研究的设计、方案、试验、样本等元数据和原始数据文件。

01 创建项目和样本

在提交入口页分别点击“项目”和“样本”进入提交流程,并在线填写“项目”和“样本”基本信息和详细信息。当信息通过校验后,系统会自动分配项目编号(CNPXXXXXXX)和样本编号(CNSXXXXXXX)。

CDCP-4.png

02 原始数据递交

在提交入口页点击“实验/测序”进入提交流程。选择单个或者批量实验/测序提交。您需要在提交流程中在线填写实验/测序的元数据,并选择合适的上传方式上传数据文件。当数据文件的状态为“校验完成”时,请点击“提交”,系统会自动分配实验/测序编号(CNXXXXXXXX/CNRXXXXXXX)。

如果您的数据量较大,建议选择Aspera高速上传。

CDCP-5.png

单细胞分析数据

单细胞分析数据归档功能,主要归档使用单细胞技术产生数据的分析结果,包括表达矩阵、MM坐标矩阵、聚类文件等。

01 单细胞递交入口

在提交入口页点击“单细胞”进入提交流程。

CDCP-6.png

02 关联项目

填写该次提交的单细胞数据关联的项目编号和细胞数量。

CDCP-7.png

03 提交单细胞数据文件和元数据

先根据数据文件格式要求和数据上传方式上传数据文件。注意:基因表达文件必须提交,其他类型的文件可选。如果您的基因表达文件、元数据文件和聚类文件需要分组,请在文件名中添加分组名称。

CDCP-8.png

下载单细胞元数据提交模板,填写后上传。系统将依次校验提交文件中的每个表,如果字段校验不通过,请根据弹框提示的校验规则和错误行号进行修改,然后重新上传。

CDCP-9.png

04 个人中心查看递交结果

当数据文件的状态为“校验完成”时,请点击“提交”,系统会自动分配单细胞编号(CSEXXXXXXX),并在10秒后跳转到我的提交-单细胞,可在此页面元数据状态列可以查看单细胞数据编号并下载元数据文件。

CDCP-10.png

如果您的数据已提交至CNGBdb-CNSA,请在文章中引用CNGBdb编号,引用方式参考如下:英文:The data that support the findings of this study have been deposited into CNGB Sequence Archive (CNSA) [1] of China National GeneBank DataBase (CNGBdb) [2] with accession number CNPXXXXXXX. 中文:该研究的相关结果数据已收录在国家基因库生命大数据平台(CNGBdb)[2] 的国家基因库序列归档系统(CNSA)[1],项目编号:CNPXXXXXXX。

参考文献[1] Guo XQ, Chen FZ, Gao F, et al. CNSA: a data repository for archiving omics data. Database (Oxford). 2020;2020:baaa055. doi:10.1093/database/baaa055. Endnote[2] Chen FZ, You LJ, Yang F, et al. CNGBdb: China National GeneBank DataBase. Hereditas. 2020;42(08):799-809. doi:10.16288/j.yczz.20-080.

原文链接:

https://www.sciencedirect.com/science/article/abs/pii/S167385272100374X?dgcid=author

信息来源:“JGG 遗传学报”公众号

上一篇下一篇

相关专题