2024-07-22 102文献解读
空间分辨转录组学 (SRT) 面临的一个紧迫挑战是对计算方法进行基准测试。一种广泛使用的方法是利用模拟数据。然而,目前可用的模拟 SRT 数据存在偏差,这严重影响了方法评估和验证的准确性。近日,《Nature Communications》发表了一个用于独立、可重复和技术多样化的 SRT 数据模拟的 Python 包——scCube,其不仅可以在基于参考的模拟中保留基因的空间表达模式,还可以在无参考的模拟中生成具有不同空间变异性的模拟数据。
scCube是一种SRT模拟器,用于模拟空间分辨转录组学中的多种空间变异性,并生成无偏的模拟SRT数据。基于变分自动编码器(VAE)框架,scCube可以在scRNA-seq(或SRT)数据中模拟不同细胞(或spot)群体的基因表达谱。接下来,可以通过基于参考或无参考的策略来生成特定种群的空间分布模式。
scCube的工作流程由两个部分组成:1)基因表达模拟;2)空间模式模拟。在基因表达模拟步骤中,scCube应用了变分自编码器(VAE)深度学习模型来模拟特定数量、类别的单细胞(或spots)的基因表达谱。scCube内置了接近300个训练完成的模型,方便用户生成特定物种和组织的模拟基因表达谱。此外,scCube同样允许用户提供自己的参考数据训练新的模型。在空间模式模拟步骤中,scCube提供了基于参考(reference-based)和无参考(reference-free)两种策略来为前一步生成的基因表达谱模拟各种空间模式。对于reference-based的空间模式模拟策略,scCube使用最优传输算法构建生成数据中细胞(或spots)与空间参考中位置之间的映射,然后将生成的细胞(或spots)映射到具有最大空间起源可能性的位置。对于无参考(reference-free)的空间模式模拟策略,scCube进一步提供了两种模拟方法。用户既可以选择使用默认的空间自相关函数生成随机的空间模式,也可以通过自定义的方式灵活模拟更加真实的组织结构。随后,通过结合模拟的基因表达谱和空间模式,scCube可以生成形式多样的无偏SRT数据。
研究人员评估了scCube与现有单细胞或SRT模拟器在各种真实SRT数据集上的模拟性能,并展示了scCube在三个基准测试应用中的实用性。结果表明,scCube是一个用户友好的框架,可以模拟无偏的SRT数据,使研究人员能够更轻松、更准确地对不同的计算方法进行基准测试和评估。
scCube相对于其他模拟器的卓越性能:相比于其他单细胞或SRT模拟器,scCube在模拟SRT数据上表现出显著的优势,能准确保留各基因的空间表达模式。
使用scCube灵活模拟生物可解释的空间模式:scCube可以允许用户灵活定制生成一系列生物可解释的空间基础及复杂模式。这些基础模式包括了非结构化的混合细胞群、细胞簇、围绕组织结构的细胞环、以及一些外部结构如血管/淋巴管等。随后,用户可以通过组合这些不同数量和种类的基础模式来灵活地生成高度定制化的空间复杂模式。例如,研究团队利用scCube准确模拟了三阴性乳腺癌的肿瘤-免疫微环境的3种典型亚型,分别对应于不同程度的肿瘤-免疫相互作用强度。
利用scCube对去卷积方法进行基准测试:为了证明方法的实用性,研究团队进一步将scCube应用于9种空间解卷积方法的基准测试研究。值得一提的是,scCube针对特定变量模拟一系列无偏SRT数据的独特优势揭示了不同空间解卷积方法对SRT数据特定分辨率的偏好,允许用户灵活地研究某些变量对不同计算方法性能的影响。
综上,scCube 可以提供可扩展、可重现和逼真的模拟,帮助用户更轻松、更准确地评估各种方法,更好地促进空间转录组数据分析方法的发展。
scCube是一个开放访问的python包,可以在GitHub存储库中获取:https://github.com/ZJUFanLab/scCube
参考文献:Qian, J., Bao, H., Shao, X. et al. Simulating multiple variability in spatially resolved transcriptomics with scCube. Nat Commun 15, 5021 (2024). https://doi.org/10.1038/s41467-024-49445-0
信息来源:“浙江大学药学院”公众号