如何在CNGBdb存储序列数据?

2020-09-09 3318CNGBdb

2020年9月2日,CNSA新增序列数据的归档功能,归档除物种基因组组装序列外的序列数据,包括核糖体RNA(rRNA)、rRNA-ITS、多细胞动物COX1、mRNA、细胞器、ncRNA、质粒、噬菌体、合成构建体等的序列数据。

序列数据递交流程:在提交序列数据之前,请先创建项目,样本可以选择性递交。注意:物种基因组数据请通过组装入口进行提交,病毒序列请通过病毒序列入口进行提交。

序列递交入口

在提交入口页点击“序列”进入提交流程。

3-1.png

提交序列数据文件和文件列表

根据数据文件格式要求和数据上传方式上传序列数据文件。

3-2.png

下载序列文件列表的提交模板,填写后上传。

3-3.png

系统会对提交的文件进行字段校验,如果校验不通过,请根据弹框提示的校验规则和错误行号进行修改,然后重新上传。

3-4.png

数据文件MD5值校验

元数据校验通过后,系统将对数据文件进行MD5值校验。可以在“数据文件状态”模块查看数据文件状态,如果有未通过校验的文件,请点击“查看”并根据弹框中的提示信息做相应处理。

3-5.png

序列格式校验

当MD5校验通过后,系统会对序列进行序列格式校验。请确保您提交的序列格式为GenBank Flat File Format(GBFF)格式。如果有未通过格式校验的文件,请点击“查看”并修改弹框提示的格式错误的序列文件,然后重新上传,系统将再次校验。

3-6.png

个人中心查看递交结果

当数据文件的状态为“校验完成”时,请点击“提交”,系统会自动为每条序列分配编号(例如N_000001234),并在10秒后跳转到“我的提交-序列”,可在此页面“状态”列下载带有编号的文件列表。如果刚提交完,该提交的“状态”列未出现“下载编号和文件列表”,说明系统正在分配序列编号,请刷新页面。

3-7.png

CNGBdb-Question Time是国家基因库大数据平台公众号全新策划的栏目,用提问的方式告你CNGBdb的正确使用方式,每周三更新。欢迎大家通过推文留言区、公众号后台、听课君微信告诉小编,你对CNGBdb的任何疑问,你的提问留言将在此栏目做解答哟!在CNGBdb递交数据的过程中遇到任何问题都可以联系:datasubs@cngb.org.

本期供稿/复核:CNGBdb 郭学芹
Dr.羊&听课君图片原创:CNGBdb 魏晓锋
编辑:尐尐呅
部分信息来源于“中国肿瘤临床”公众号,如有侵权请联系删除。

上一篇下一篇

相关专题