CNSA: 国家基因库核酸序列归档系统


国家基因库核酸序列归档系统(CNSA)是一个方便快捷的在线提交生物研究项目、样本、实验等信息数据的系统,结合国际核酸序列数据库(International Nucleotide Sequence Database Collaboration,INSDC)标准和Datacite标准,遵循Fort Lauderdale Agreement、NHGRI Rapid Data Release Policies、Joint Data Archiving Policy、CC0-No Rights Reserved等国际数据开放协议,接受来自全球科研的测序研究数据(包括原始数据和其他支撑数据)递交,其数据递交服务可作为文献出版流程的补充,支持早期数据的共享。CNSA致力于生物测序信息和数据的存储和共享, 旨在为全球的研究者提供当前最全面的数据和信息资源,促使研究人员能够便捷深入的访问和使用数据。

检索


提供全局检索,可查询 CNSA 中所有已发布的项目 / 样本 / 实验 / 测序 / 组装 信息。不提供GigaDB的检索结果,若要检索GigaDB,请点击http://gigadb.org/进行查询。

示例: 编号 CNP000001/CNS00001/CNX000001/CNR00001/CNA000001,项目标题,样本名称,实验标题,物种名称,数据类型,样本类型,描述信息。

提交流程


CNSA目前包含原始数据和其他支撑数据的提交流程,批量递交元数据和数据文件的流程正在开发,如需要进行批量提交或对以下两种提交流程有任何疑问,可以联系管理员(datasubs@cngb.org)寻求帮助。

原始数据提交

原始数据(指测序产生的未经任何过滤的全部下机数据)提交:需要发表文章且符合人类遗传资源条例和伦理的数据默认通过本服务流程同步至EBI-ENA;如果递交的数据需要权限控制,或者需要选择上传数据到 NCBI SRA 或者 DDBJ DRA,请点击帮助

其他支撑数据提交

其他支撑数据,作为原始数据的补充,包括但不限于过程和结果数据、分析方法、软件程序、图像文件、音频文件、视频文件、成像文件、电子图表和word文档等。CNSA与Gigascience旗下的GigaDB合作共同审编和归档此类数据,同时通过与DataCite的链接,每个数据集都将被分配一个DOI,可快速被引用。详情请点击帮助

数据统计


物种在样本中分布

在下面图表中,每种颜色代表了一个物种。每个颜色的饼块由内圈和外圈构成。内圈代表的是当前物种所有的样本数。外圈可以由深浅两种颜色分成两块,深色块代表的是当前物种中已公开的样本数,浅色块代表的是未公开的样本数,根据样本的公布情况,外圈的两个色块不一定都会存在。

研究最热门的10个物种

生物/物种名称样本未公开已公开