2022-05-23 2578文献解读
今天给大家“投喂”的这篇文献来自Nature子刊《Nature Methods》,研究人员对空间转录组和单细胞转录组整合分析工具进行比较,以衡量其性能。
空间转录组学方法允许我们在空间中检测RNA转录物,这些方法已被用于研究各种组织和器官中基因表达的空间分布,包括大脑、心脏、胰腺和皮肤。一方面,基于原位杂交和荧光显微镜(基于图像)的空间转录组学方法(包括seqFISH、osmFISH和MERFISH)能够以高分辨率和准确度检测转录物的空间分布,但它们只能检测RNA转录物的总数。另一方面,基于下一代测序(基于测序)的空间转录组学方法,如ST、10X Visium和Slide-seq,可以从空间中的点在整个转录组水平上捕获表达的RNA,但每个点(半径10~100µm)可能包含多个细胞,这限制了这些方法的空间分辨率。这些空间转录组学方法的局限性阻碍了它们在空间单细胞分辨率下捕获整个转录组尺度数据的能力。
为了突破空间转录组学方法的局限性,生物信息学家提出并开发了多种整合方法,将空间转录组学和单细胞转录组(scRNA-seq)数据结合起来,包括gimVI、SpaGE、Tangram、Seurat、novoSpaRc、SpaOTsc等。目前还没有一项独立研究全面比较这些整合方法在预测转录物的空间分布或组织切片中斑点的细胞类型去卷积方面的性能。因此,此项研究的科研人员使用多种指标系统地对16种整合方法的性能进行基准测试。
研究人员在多个数据集上使用皮尔逊相关系数(PCC)、结构相似性(SSIM)、均方根误差(RMSE)、JS散度对相关工具进行性能评估,同时聚合上述四个指标来定义准确度评分(AS),以简化对每种整合工具准确度的评估(AS值越高表示性能越好)。
Tangram、gimVI和SpaGE在预测转录物的空间分布方面优于其他整合方法,其中Tangram、gimVI和SpaGE在处理10X Visium、seqFISH和MERFISH平台生成的数据方面优于其他整合方法,Tangram和gimVI是处理Slide-seq数据集的优选方法。
同时,Tangram、gimVI和SpaGE在预测高度稀疏数据集转录本的空间分布方面也优于其他整合方法。
在预测斑点的细胞类型组成方面,Cell2location、SpatialDWLS、RCTD和STRIDE的表现超过了其他整合方法。
在计算资源方面,Seurat是预测转录物的空间分布的计算效率最高的方法;Tangram和Seurat是处理细胞类型去卷积的最高效方法。
综上所述,Tangram、gimVI和SpaGE在预测转录本的空间分布方面优于其他整合方法,而Cell2location、SpatialDWLS和RCTD在对组织学切片中的斑点进行细胞类型去卷积方面优于其他整合方法。
基于概率模型结合负二项分布或泊松分布构建的方法,如gimVI、Cell2location和RCTD,通常在预测转录物的空间分布或去卷积斑点的细胞类型方面表现更好。深度学习算法也应用于多种整合方法中,其中Tangram是预测未检测到的转录本空间分布性能最好的方法之一。
针对空间转录组学表达矩阵的稀疏性问题,有多种策略:研究人员可以增加测序深度,用严格的cut-off值筛选斑点和基因,以减少过滤表达矩阵的稀疏性,或者考虑应用插补算法(例如SAVER、MAGIC和WEDGE)来插补表达式矩阵中的零元素。
空间转录组学的另一个潜在应用是预测空间上彼此接近的两种细胞类型之间的配体-受体相互作用,目前已经开发了许多分析工具,如SpaOTsc、Giotto、CellChat、NicheNet、ICELLNET和SingleCellSignalR等。
建议对测试细节感兴趣的小伙伴参考文献原文~也可以访问如下链接了解详情 https://github.com/QuKunLab/SpatialBenchmarking
参考文献Li, B., Zhang, W., Guo, C. et al. Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution.Nat Methods (2022). 图片均来源于参考文献,如有侵权请联系删除。