2022-09-01 1128文献解读
2022年3月,来自同济大学的科研团队在《Nucleic acids research》发表了一种基于主题模型的空间转录组学去卷积方法:STRIDE,通过机器学习方法及数据整合,将空间转录组学数据提升至单细胞精度。
STRIDE是一种基于主题模型的去卷积方法,通过与匹配的scRNA-seq整合用于空间转录组学分析。STRIDE首先通过进行主题建模从注释的单细胞转录组中发现细胞类型相关的主题。然后,STRIDE应用预先训练好的主题模型来推断空间转录组中每个位置的细胞类型组成。
首先,STRIDE估计来自scRNA-seq的基因-主题分布和主题-细胞分布。然后通过贝叶斯定理将逐个主题的分布总结为逐个主题的细胞类型分布。接下来,应用预训练的主题模型来推断空间转录组学中每个位置的主题分布。通过结合细胞类型-主题分布和主题-位置分布,可以推断每个空间位置的细胞类型比例。STRIDE还提供多种下游分析功能,包括特征检测和可视化、空间域识别和从同一组织的连续ST切片重建空间结构。
开发团队通过使用模拟的空间转录组数据,验证了STRIDE预测细胞类型比例的高精度和灵敏度。为了证明STRIDE的广泛效用,开发团队将其应用于三个不同组织的空间转录组学数据集,包括小鼠小脑、人类鳞状细胞癌(SCC)和人类发育中的心脏,证明了STRIDE产生的主题可以准确地反映每种细胞类型的空间特征,提高空间聚类的分辨率,最终有助于在整合多个切片的基础上重建组织的三维结构。
首先验证了主题建模发现细胞类型特定主题的能力。开发团队得出了28个不同的主题,这些主题在不同的细胞类型中富集(上图A),表明主题与特定的细胞类型之间存在关联。
此外,当使用用于训练的相同scRNA-seq数据集验证训练后的主题模型时,STRIDE取得了较高的细胞类型分配准确性(87.13%,n = 33043个细胞)(上图B)。
接下来,开发团队比较了STRIDE与其他已发布的细胞类型去卷积工具的性能:STRIDE显示了预测与基础事实之间的最高一致性,而RCTD和cell2location的一致性稍差(上图D);STRIDE实现了灵敏度和特异性之间的平衡,而其他方法以牺牲低灵敏度为代价实现了高特异性(上图E)。
上述结果表明,STRIDE能以较高的精度估计不同类型细胞的比例,并能兼容空间共定位的细胞类型分布以及低测序深度。
在小鼠小脑数据集上应用STRIDE揭示了细胞类型的空间定位模式和新的空间特征。
STRIDE表征了人类鳞状细胞癌微环境中肿瘤细胞的空间异质性。
STRIDE检测到人类心脏发育过程中罕见细胞类型的位置。
STRIDE利用主题实现了发育中人类心脏的3D架构构建。
STRIDE可以基于潜在主题去卷积空间转录组学的细胞类型组成。另一方面,单细胞和空间转录组学的共享主题也可用于将单细胞映射到空间位置。这样,单细胞多组学数据(如scNome-seq和scNMT-se),可以通过scRNA-seq与空间转录组学整合,以揭示空间调控机制。随着时空转录组学和调控谱的积累,STRIDE可以进一步加强,以阐明组织发育或肿瘤发展过程中的时空多组学动态。此外,目前大多数空间技术都是在二维空间中量化基因表达和推断细胞类型分布。尽管基于主题的多个空间转录组学样本的整合被证明有助于组织结构的三维重建,但预计在成像数据和其他方式的数据的帮助下,将有可能通过STRIDE建立一个更全面和多尺度的三维组织图谱。
STRIDE是一个开源python包,其源代码可以在如下链接获取: https://github.com/wanglabtongji/STRIDE.
参考文献Sun D, Liu Z, Li T, et al. STRIDE: accurately decomposing and integrating spatial transcriptomics using single-cell RNA sequencing[J]. Nucleic acids research, 2022, 50(7): e42-e42. 图片来源于Nucleic acids research官网和参考文献,如有侵权请联系删除。