/
/
/
长期保存计划

长期保存计划

2025-02-27 09:55:34
2025-03-10 11:43:41
256

目的

深圳国家基因库序列归档库(CNSA)致力于确保生物序列数据的长期保存和可用性,从而促进和推动生物科学研究。本保存计划概述了CNSA关于数据存档、审编、长期保存和公开共享的策略,旨在保护数据免受丢失或破坏,维持数据的可访问性,并通过适当的数据审编等行为保证数据的质量和可用性。

合法合规性

CNSA遵守中华人民共和国的法律法规、国际准则和行业惯例,以合法合规的方式长期保存生物数据。当向CNSA递交数据时,递交者必须遵守当地的法律法规,特别是与伦理生物安全和人类遗传资源相关的法律法规,并对数据进行匿名化或去标识化以保护个人隐私。

数据标准

CNSA采用了来自国际核苷酸序列数据库协作组织(INSDC)、DataCite、全球基因组学与健康联盟(GA4GH)、全球基因组生物多样性网络(GGBN)等知名联盟和组织的数据标准。CNSA要求数据递交者提供详尽的元信息,确保数据的可理解性以便于长期保存。CNSA支持常用的数据格式(如FASTQ、FASTA、VCF等),并为数据递交者提供元信息和数据文件的提交指南。CNSA会不定期更新数据归档标准以适应技术的发展。

数据归档和审编

CNSA支持多种类型数据的归档,如原始测序数据、组装、变异信息、代谢数据、单细胞数据和其他序列数据。为了确保数据质量,CNSA会对递交的数据进行自动和人工审核。为了确保数据的完整性,CNSA会在每次递交和传输活动中校验数据的MD5值。

可访问性

为了在保护数据隐私和确保数据安全的前提下进行数据共享,CNSA提供了不同级别的数据访问权限。公共数据接受公开访问,而受控数据的访问则需用户提交申请。数据的访问权限由数据递交者自行设定。

安全性

CNSA对归档的数据进行备份。本地数据和备份数据均定期使用MD5校验数据的完整性。CNSA定期检查存储设备的状态,并更换任何有缺陷的存储设备。万一存储设备出了问题,CNSA将从备份数据中恢复数据。CNSA采取了一系列的安全措施来保护数据,例如对敏感数据的加密。相关的一系列操作会由训练有素的员工来进行,并且CNSA也提供了持续的培训来确保员工的相关技能。CNSA还对数据恢复制订了详细的计划来避免因技术故障或网络攻击等原因造成的数据丢失。

长期保存和迁移策略

CNSA制订了相关策略来确保数据的长期访问和可用性,包括随着技术的发展,将数据迁移到新的系统。

审查和更新

此份保存计划将会不定期进行更新。CNSA有专门的团队负责定期审查和更新该保存计划,以确保其可操作性和实用性。