2022-02-23 993CNGBdb
在递交变异数据前,需先递交研究相关的项目、样本信息,测序产生的原始数据也可通过CNSA递交,之后可通过变异数据递交入口递交各种类型的变异数据,包括SNP、SV和临床相关的人类基因组变异(CAHV)
在提交入口页点击“项目”进入提交流程,并在线填写的“项目”基本信息和详细信息。当信息通过校验后,系统会自动分配项目编号(CNPXXXXXXX)。
在创建项目过程中,请注意选择您的数据管理方式,关系到您论文的顺利发表。
动植物等不涉及人类遗传资源的数据,请尽量选择公开的数据管理方式,公开时间可设置为文章投稿前,以便您的数据能够被期刊的编辑访问,为降低拒稿可能,建议您将数据公开。若是您计划文章接收后再公开数据,请您提前向CNSA邮箱(datasubs@cngb.org)申请数据的reviewlink,并将reviewlink发送给期刊,以便期刊编辑查看您在CNSA递交的数据信息。请注意,reviewlink信息不包含数据文件,编辑无法查看到您项目数据文件。
人相关的数据,在未获得科技部人类遗传资源开放共享备案申请前提下,请您选择受控的数据管理方式,信息公开时间尽量设置为文章投稿前,以便编辑能够访问到您的项目信息。请注意,受控的管理方式,编辑或是用户访问不到您的数据文件,若需下载和使用数据文件,需获得您的审核同意。若是您计划文章接收后再公开受控项目的信息,请您提前向CNSA邮箱(datasubs@cngb.org)申请数据的reviewlink,并将reviewlink发送给期刊,以便期刊编辑查看您在CNSA递交的项目信息。
在提交入口页点击“样本”进入提交流程,并在线填写“样本”的基本信息和详细信息。当信息通过校验后,系统会自动分配样本编号(CNSXXXXXXX)。
请根据您实际的样本情况,选择合适的样本类型,下载对应的样本模板,填写后上传。为确保您样本的准确性和唯一性,具有相同样本属性的样本会被系统判定为同一样本,请注意填写您的样本属性信息。
在提交入口页点击“实验/测序”进入提交流程。选择单个或者批量实验/测序提交。您需要在提交流程中在线填写实验/测序的元数据,并选择合适的上传方式上传数据文件。当数据文件的状态为“校验完成”时,请点击“提交”,系统会自动分配实验/测序编号(CNXXXXXXXX/CNRXXXXXXX)。
CNSA为您提供三种数据文件上传方式,小样本量数据可通过FTP上传。在国家基因库读平台测序的数据可通过国家基因库内部集群快速上传。如果您的数据量较大,建议选择Aspera高速上传。
数据上传后,系统会对上传的数据文件进行MD5值校验,通过检查文件的MD5值与您在模板中填写的MD5值的一致性,若是MD5值一致,校验通过。此外,已上传归档的文件请不要随意移动。
Linux 系统:通过执行下面命令获得文件的MD5值$ md5sum file1 file2 9F6E6800CFAE7749EB6C486619254B9C file1 B636E0063E29709B6082F324C76D0911 file2
Mac OS X系统:通过执行下面命令获得文件的MD5值$ MD5 file1 file2 9F6E6800CFAE7749EB6C486619254B9C file1 B636E0063E29709B6082F324C76D0911 file2
Windows系统:step1:按计算机键盘上的【win】+【r】键来打开运行命令行窗口,然后,在弹出的运行窗口中输入“cmd”。step2:点击“确定”,进入cmd命令行界面。使用如下命令做计算MD5值:CertUtil -hashfile 路径\文件名 MD5
在提交入口页点击“变异”进入提交流程。CNSA支持SNP、SV和CAHV。
三种变异类型递交:SNP是指简单且长度<=50bp基因组变异,例如单核苷酸多态性(SNP)、插入和缺失突变(INDEL)、微卫星重复等。SV是指复杂且长度>50bp的基因组结构变异(SV),例如插入、缺失、重复、倒位、易位、可移动元件等。CAHV是指临床相关的人类基因组变异,包括基因组变异及相关的表型和临床意义等。
如果选择SNP,需要先上传变异的VCF文件至FTP,然后下载SNP提交模板,填写后上传。如果选择SV,需要下载SV提交模板,填写后上传。VCF文件可选择性提交。如果选择CAHV,只需要下载提交模板,填写后上传。
当数据文件的状态为“校验完成”时,请点击“提交”,系统会自动分配变异的编号(CVARXXXXXXXX)。
如果校验通过,点击“提交”,系统将在10秒后跳转到“我的提交-变异”,数据审核通过后,可在此页面状态列下载带有编号的元数据文件。