BT × IT | DeepST:通过深度学习识别空间转录组学中的空间域
2022-11-10252

识别空间域(即在基因表达和组织学上具有空间相关性的区域)是空间转录组学中最重要的课题之一。近日,《Nucleic Acids Research》发表了一个准确且通用的深度学习框架:DeepST,用于识别空间域。

 

DeepST是什么?图片

 

DeepST是一个可定制的ST深度学习框架,可以准确识别空间域。DeepST使用预先训练好的深度神经网络模型从形态学图像块中提取特征向量,然后将提取的特征与基因表达和空间位置数据整合,以表征空间相邻点的相关性,并创建空间增强的基因表达矩阵。DeepST使用图神经网络(GNN)自动编码器和去噪自动编码器联合生成增强ST数据的潜在表示,而域对抗神经网络(DAN)用于整合来自多个批次或不同技术的ST数据。

 

(A) DeepST工作流程从ST数据开始,以苏木精和伊红(H&E)染色(可选)、空间坐标和空间基因表达作为输入。(B) DeepST最初使用H&E染色来收集组织形态学信息,然后使用预先训练的深度学习模型,根据与相邻斑点的相似性,对每个斑点的基因表达进行标准化。通过该矩阵计算相邻点之间的形态相似性,并将基因表达权重和空间位置权重合并,为点内的每个基因重新分配一个增强的表达值。(C) DeepST生成三个网络框架,其中一个去噪自动编码器网络和一个变分图自动编码器用于提取最终的潜在嵌入,一个域鉴别器用于融合来自不同分布的空间数据(红色虚线框,该部分仅用于整合任务)。

 

DeepST的性能测试图片

开发团队对不同平台(如10×Visium、Slide-seqV2和Stereo-seq)生成的ST数据作为基准,将DeepST与现有算法进行了广泛的测试和比较。DeepST还可以处理基于成像的分子数据(例如MERFISH、4i和MIBI-TOF),特别是在MERFISH数据上提取三维(3D)表达域。通过对乳腺癌ST数据集的进一步测试,DeepST识别了视觉上同质肿瘤区域内的异质子区域,这些子区域在传统的肿瘤内结果中未检测到。综上所述,DeepST在准确识别空间域方面具有强大的能力,在处理其他空间组学数据方面也具有可扩展性。

为了评估DeepST识别空间域的性能,开发团队使用10×Visium ST基准数据集(背外侧前额叶皮质(DLPFC)),将DeepST与两种非空间算法(K-means和Seurat)和四种最近发布的空间聚类算法(stLearn、SpaGCN、SEDR和BayesSpace)进行了比较,结果表明DeepST识别的空间域与DLPFC的手动注释和神经科学中皮质分层的定义相一致,其性能优于现有方法。

 

同时,开发团队还进一步评估了DeepST在10×Visium小鼠脑组织数据集中识别空间域的有效性,并将DeepST识别的空间域与Allen mouse brain Atlas脑解剖参考注释进行了比较。DeepST可清楚地检验与参考注释一致的脑结构;当空间域的数量不是先验时,DeepST 自适应计算最佳聚类分辨率;确定相同数量的空间域时,DeepST 还展示了其识别空间域的卓越能力和高效性能。

 

DeepST可以在更精细的水平上剖析癌症组织的空间结构域:在乳腺癌(浸润性导管癌)的公共ST数据上,DeepST获得的域与手动注释高度一致。与其他空间算法识别的域相比,DeepST发现的区域具有更多的区域连续性和更少的噪声。在另一个人类乳腺癌(原位导管癌)的ST数据上,DeepST域比其他空间算法更流畅、更连续,这反映了DeepST处理对复杂组织进行精细分割的能力。此外,DeepST还能够识别具有不同生物功能的精细区域。

除了10×Genomics Visium平台之外,开发团队还研究了DeepST对基于成像的分子数据(MERFISH、4i和MIBI-TOF)和高分辨率ST数据(Stereo-seq和Slide-seqV2)的适配能力,结果表明DeepST适用于不同平台的各种空间组学数据。

 

DeepST的模型构造非常灵活。首先,它提供了多种图形神经网络类型供用户选择。其次,DeepST在参数选项中为用户提供不同ST平台的多种预设选择。最后,DeepST相邻图的参数调整允许用户对空间信息确定不同的权重,以便准确识别空间域。此外,DeepST计算速度快,内存利用率高。在后续的工作中,开发团队将进一步考虑模型的适用性和收敛稳定性的必要性。

 

DeepST算法的代码和详细教程可在如下链接获取: https://github.com/JiangBioLab/DeepST

参考文献

Xu C, Jin X, Wei S, et al. DeepST: identifying spatial domains in spatial transcriptomics by deep learning. Nucleic Acids Res. 2022 Oct 17:gkac901.

图片来源于Nucleic Acids Res官网和参考文献,如有侵权请联系删除。