2024-04-15 69文献解读
空间分辨组学技术正在改变我们对生物组织的理解。然而,由于数据量大、数据类型异构以及缺乏灵活的空间感知数据结构,单模式和多模式空间组学数据集的处理仍然是一个挑战。2024年3月,《Nature Methods》发表了一个建立统一、可扩展的多平台文件格式的框架——SpatialData,为空间注释和跨模态聚合与分析提供便利。
SpatialData是一个灵活的、基于领域标准的框架,用于存储、处理和注释来自迄今为止几乎任何可用的空间组学技术的数据,实现了多模态空间组学数据的可查找、可访问、可互操作、可重用(FAIR)集成。独立于语言的存储格式提高了数据源的互操作性,而Python库则标准化了不同数据类型的访问和操作。SpatialData格式支持所有主要的空间组学技术和衍生量。
为了说明SpatialData在多模态整合与分析方面的实用性,开发团队使用该框架来表示和处理一项乳腺癌研究的数据,该研究结合了苏木精和伊红(H&E)图像以及 10× Genomics Visium 和 Xenium 检测。
开发团队使用napari-spatialdata定义所有数据集中存在的地标点,然后使用变换对齐所有三个数据集来定义通用坐标系(CCS)。对齐的结果显示:SpatialData 能够识别公共空间区域,可以使用跨数据集的SpatialData 查询来访问该空间区域。接下来,利用来自所有三个数据集的集体信息创建了一套共享的空间注释。最后,举例说明如何使用SpatialData在数据集之间传输空间注释和聚合功能,这些示例说明了聚合功能的灵活性,可以在不同类型的spatialelement(点、圆形捕获位置、细胞和更大的解剖ROIs)之间应用,以传输不同类型的空间注释(细胞表达、细胞类型分数)。
总之,SpatialData框架提供的灵活性和随时可用的解决方案为分析提供了新的可能,并提高了综合空间分析的可重复性。
随着SpatialData使用率的不断提高,其实用性也将进一步增强,正在进行的开发扩展了SpatialData与R/Bioconductor的互操作性,提供对多尺度点和多边形表示的支持,并支持以编程方式和通过可视化工具Vitessce进行基于云的数据访问。
SpatialData是通过pip作为Python包提供的,并附带了大量的示例和教程,可从如下文档中访问: https://spatialdata.scverse.org.
参考文献: Marconato, L., Palla, G., Yamauchi, K.A. et al. SpatialData: an open and universal data framework for spatial omics. Nat Methods (2024). https://doi.org/10.1038/s41592-024-02212-x