2021-10-13 2013CNGBdb
2021年9月27日,由国家基因库牵头起草的两项团体标准:《单细胞转录组学数据集》(标准编号:T/SZAS 39—2021)和《蛋白质组学数据集》(标准编号:T/SZAS 40—2021)正式发布,并于9月28日正式实施。
生命大数据具有多水平、复杂性高、数据量大、跨学科等特点,天然的数据特性给数据应用及共享带来巨大的挑战。数据的标准化是实现其开放共享的关键。构建生命大数据标准化体系,从数据标准、技术标准、应用标准、安全标准等方面全面推进,为实现生命大数据的采集、存储、治理、共享提供基础保障,才能使数据发挥价值,有效推动生命科学研究的创新发展。
本次两项团体标准的发布填补了国内单细胞和蛋白质组领域数据标准的空白,为进一步制定两大领域的国际标准和信息分析标准奠定了基础,同时也促进了相关领域标准体系的建立。
单细胞转录组技术使研究者能够以前所未有的分辨率研究基因表达图谱。本标准规定了单细胞转录组学数据的范围、数据文件要求、数据元目录和数据归档目录,不仅有效促进了单细胞转录组数据的共享和整合,有利于单细胞领域标准化分析流程的建立,同时也为空间组学数据标准的起草提供参考。
蛋白质组学技术使直接研究翻译后修饰以及翻译后结构的加工成为可能。本标准规定了蛋白质组学数据的范围、数据元的规范化定义及数据元目录、归档目录和数据格式要求,适用于蛋白质组学数据集信息的存储、治理、交换与共享。其发布将全面提升蛋白质组学数据的利用率,促进生物医药领域的创新研究及临床转化。
自成立以来,国家基因库利用生命科学和生物信息数据科学的前沿技术,与业内领先的机构及国内外的标准化组织合作,共同建立样本、数据、技术等国际、国内相关标准,引领行业规范有序发展。除ISO/TC276国内技术对口单位之外,国家基因库还担任全球基因组学生物多样性联盟(GGBN)核心成员单位、国际生物与环境样本库协会(ISBER)成员单位、SAC/TC559 全国生物样本标准化技术委员会成员单位等。
截至2021年10月9日,国家基因库参与起草并发布实施的标准达59项,其中包括1项国际标准、7项国家标准、10项地方标准、10项团体标准、31项企业标准,填补多项行业空白。未来,国家基因库将继续大力推动实施标准化战略,加快构建推动高质量发展的标准体系,深度参与国际、国内标准的制定,充分发挥标准化在生物领域建设中的基础性、战略性作用,引领行业健康、有序、可持续发展。