2021-10-08 1377文献解读
节后收心小秘方:和小编一起梳理空间转录组学的基础知识点,快速进入学习状态!这次的参考文献来自《Emerging Topics in Life Sciences》的一篇Perspective,文章概述性地介绍了空间转录组学的技术方法、分析目标、分析方法、挑战与展望。对深入探讨感兴趣的读者,建议查阅最近的优秀资源。
注:不同于综述文章,Perspective中的描述和观点相对主观,如有不同意见建议与作者交流(ilukic@partek.com)。
空间转录组学的技术解决方案大致分为两种:基于显微切割的方法和原位方法。基于显微切割的方法的基本前提是,利用某种物理破坏(如激光显微切割)将样本从预先定义的组织点中分离出来,然后进行分子反应以检测mRNAs。相比之下,另一个系列的方法不依赖于组织的物理分隔,目标分子(如mRNAs)是在原位直接检测的。
基于荧光原位杂交(FISH)的方法:multiplexed error-robust FISH、MERFISH;
依赖于原位测序的方法:in situ sequencing padlock method(使用挂锁探针进行原位测序);
使用原位捕获目标分子并随后测序的方法:Visium by 10× Genomics、 nanoString’s GeoMx platform、Slide-seq。
许多用于空间解析数据的生物信息学工具可与scRNA-seq共享,分析管道在量化矩阵阶段有所不同。分析管道有Space Ranger by 10× Genomics、kallisto | bustools、PartekⓇ FlowⓇ等。
空间分辨转录组学实验分析的关键步骤之一是确定细胞类型。对于一些方法来说,数据点不是单个细胞,而是由细胞混合物组成的组织点。原则上,可以使用为批量RNA-seq分析开发的任何方法推断其细胞组成,但需要注意的是:(1)空间数据的样本量可能太小(每个数据点的细胞太少);(2)计算效率低下。
细胞类型去卷积,是用于估计混合物(数据点)中每种细胞类型的比例以及每个细胞的基因表达水平(在同一数据点内)的算法。大多数工具的开发考虑到了原位捕获和随后的高通量测序产生的数据,它们可能是工具包的一部分(DestVI、Seurat、Giotto)或独立的工具(SpatialDWLS、DSTG、SPOTlight、SpatialDecon)。如果没有参考特征(如新的或未进化的细胞群),像STdeconvolve这样的工具可以以无监督的方式识别细胞类型的特定转录谱以及细胞类型丰度。此外,对于利用原位杂交的空间技术也存在计算解决方案。
接下来,空间转录组学分析的一个典型目标是检测与特定组织区域有关的基因。一种可能的方法是在这些区域之间进行差异性表达分析,类似于scRNA-seq实验中的细胞组之间的比较。这些组织区域可以通过手工图像注释(即通过检查组织切片)或使用基于mRNA数据的聚类(即根据基因表达谱将组织分为几个部分)来定义。对于后一种方法,经常使用Louvain算法的一个变化进行聚类。值得注意的是,这些策略中的任何一种都依赖于组织区域之间定义明确的边界。然而,生物边界可能是模糊的,即感兴趣的基因可能在整个组织中显示梯度。一个流行的专门用于梯度检测的方法是SpatialDE。此外,SpaGCN等工具将组织学像素强度作为额外的输入,以确定基因表达与组织学一致的空间域。同样值得一提的是,尽管基因表达可能由细胞之间的距离决定,但它也可能因不同的方向而变化(如在大脑皮层),SPATA是能够处理这种现象(即各向异性)的工具之一。
检测具有空间特异性分布基因的一个扩展是使用表达数据来了解更多有关组织结构的信息,即基于基因表达而不是形态学来发现新的组织区域或结构。计算方法可能涉及检测“原型”基因表达模式(即具有空间特异性分布的基因簇)的初始步骤,例如GLISS;或者依赖基于基因表达的空间区域的直接识别,例如Baysor。
如前所述,对空间分辨转录组学数据的分析提供了检测组织内或特定感兴趣区域内的细胞类型的可能性。在此基础上,开发的计算工具考虑了细胞的位置和表达信息,能够对细胞相互作用进行推断(例如SpaOTsc)。从生物学家的角度来看,值得注意的是,细胞-细胞相互作用的分析不仅限于相邻细胞,还可以把研究扩展至更广泛的、区域性的范围(例如 ‘juxtaview’ of the MISTy package)
空间转录组学不是研究空间基因表达的唯一方法。有一些计算工具允许我们只从一种模式(如基因表达)开始,推断另一种模式(即空间关系)。例如novoSpaRc,其根据scRNA-seq表达数据预测细胞的定位,即根据细胞的基因表达表征生成细胞之间的空间关系("组织图")。另一个工具是RNA-Magnet,它根据细胞表面受体及其同源表面配体的表达模式,预测单细胞之间潜在的物理相互作用。
另一个方向,PathoMHC将苏木精-伊红染色的玻片分解成小块,利用TCGA的表达数据为每块玻片生成基因表达分数。一个类似的工具STvEA将多重免疫组化数据作为输入,并通过引用的CITE-seq实验图谱中的基因和蛋白质表达数据对其进行注释。
空间转录组数据分析也存在一些挑战:(1)数据越来越复杂(数据量及数据复杂程度变大;组织学数据特有的“额外”空间维度);(2) 需要手动图像注释。
最后,作者在观点及展望部分提到:未来的瓶颈可能不是生成数据的能力(即湿实验室方面),而是处理数据的能力。与解释相比,数据的大小和复杂性似乎是一个小问题。
数据解释不是从一个方向(解释多组学检测),而是需要从两个方向(解释标本的微观外观)来处理。从一个简单的例子开始,这个例子并不是专门针对空间技术的,如果我们有关于大脑皮层的染色质可及性、基因表达和蛋白质表达的数据,我们如何综合这些数据并深入了解大脑的功能?
此外,从另一个角度来看,如何将形态学发现纳入多组学研究?
尽管有一些障碍,空间技术似乎是当前生物学中最有前途的技术,不仅有可能补充甚至取代传统工具,如组织染色。一旦计算工具成熟,例如在bulk RNA-seq中,我们可以预见空间多组学的使用将超越基础或转化研究,并随后改变医学诊断。
参考文献
Lukić K. Bioinformatics approach to spatially resolved transcriptomics[J]. Emerging Topics in Life Sciences, 2021.
图片均来源于参考文献,如有侵权请联系删除。