Back to top
数据标准
2025-01-08 16:57:58
2025-02-24 09:15:50
392
开放数据共享是生命科学创新和研究的基础。标准的数据结构是数据共享和应用的前提,CNGBdb整合了国际核酸序列数据库联盟(INSDC),全球基因组学与健康联盟(GA4GH),全球基因组生物多样性联盟(GGBN),美国医学遗传学与基因组学学会(ACMG)等国际组学、健康、医学方面的数据结构和标准,构建了具有广泛兼容性,标准化的数据标准和结构。CNGBdb将GGBN的样本标准应用到样本收集和样本数据共享,确保样本数据能够开放共享和再次利用等。并将GA4GH标准应用到个人数据集,确保健康数据集能够给有数据权限的研究人员使用。CNGBdb基础数据中的项目、样本、实验/测序、组装、注释模块的数据参考了INSDC数据结构,以便能够和EBI、NCBI、DDBJ等国际数据共享中心共享数据,能够给全球更多的研究人员使用。与此同时,CNGBdb构建的开放数据结构元数据标准应用集可通过CNGBdb数据集进行访问。
INSDC是一项长期的基础计划,在DDBJ,EMBL-EBI和NCBI之间运作。 INSDC涵盖了数据原始测序reads的数据谱,从比对和组装到功能注释,丰富了样本和实验配置相关的上下文信息。
GA4GH是一个国际性的非营利性联盟,成立于2013年,旨在加速研究和医学的潜力,促进人类健康。 GA4GH社区汇集了500多个从事医疗、研究、患者倡导、生命科学和信息技术的领先组织,共同创建数据结构和标准,以便负责、自愿和安全地共享基因组和健康相关数据。
GGBN数据标准是一组词汇表,旨在表示与凭证标本、组织样本和收集相关的组织、DNA或RNA样本。
ACMG的活动包括制定实验室发展和实践的标准和指南,倡导医疗保健和公共卫生领域的优质遗传服务,以及促进诊断、治疗和预防遗传病的方法的发展。