2021-12-06 1710文献解读
今年2月《Emerging Topics in Life Sciences》刊出题为“Space: the final frontier — achieving single-cell, spatially resolved transcriptomics in plants”的综述文章,简要回顾了空间转录组学方法的发展,并强调了目前在植物中实现三维空间转录组学的实验和计算方面的进展和挑战,特别关注这种方法如何接近单细胞分辨率。同时还确定并探讨了在植物学中进一步推进空间转录组学的潜在机会。
在植物中,已经建立了几种在组织切片、细胞类型和/或单个细胞中进行转录分析的方法。这些方法通常需要细胞分类、转基因植物、原生质体或其他破坏性的过程。这些技术中的大多数在实现过程中会丢失大部分或全部空间分辨率。那些为RNA提供高空间分辨率的技术在表征转录物的数量上缺乏广泛性。目前在植物中获得精确空间数据的最佳方法之一是进行荧光原位杂交(FISH)显微镜检查,但这通常一次只检测一个基因,大大限制了检测通量。
虽然最新的空间转录组学方法最近受到关注,但从空间上解决组织切片和细胞中基因表达的方法已经存在了几十年。诸如激光捕获显微切割(LCM)和FISH等技术常用于植物和哺乳动物的研究,可以达到单细胞和亚细胞的分辨率。当基于芯片的系统在2016年首次被引入哺乳动物系统时,其目的是在组织切片中以足够高的分辨率捕捉更大的空间内容,以获取有关基因表达分布的数据,其主要缺点是分辨率被限制在100mm。虽然芯片系统平台(主要集中在哺乳动物组织)已经发展到可以产生明显更高的分辨率,但植物中的方法还没有突破最初的100mm。与哺乳动物相比,该技术在植物中的应用滞后的原因之一是与细胞壁有关。大多数高分辨率、空间解析的方法,包括Slide-seq和High Definition Spatial Transcriptomics,可能需要原生质体,这在一些植物系统中不容易实现。
为了在植物中实现单细胞、空间转录组学,一种潜在的方法是继续提高基于芯片的方法的分辨率(即更小的点,更密集的间隔)。开发一种能够合成具有高保真寡核苷酸探针更密集的芯片的仪器将是在植物中生产高空间分辨率转录组学平台的关键。
植物细胞在转录分析方面有一些独特的挑战,包括某些细胞结构的性质,如细胞壁、液泡和叶绿体。植物组织通常含有质外体pockets of air,这可能导致冷冻切片的问题。另外如果目标组织是叶片,固有曲率导致需要更多的截面来完全捕获组织体积(即从近轴面到远轴面),并且还需要考虑截面的厚度。在植物和哺乳动物系统中,大多数空间转录组学方法都使用厚度在10到20毫米之间的组织切片。由于植物的细胞壁结构复杂,过厚的切片可能导致mRNA释放或捕获减少,而过薄的切片容易出现切片伪影或转录水平低。此外,植物细胞的大中央液泡将细胞质RNA限制在薄的外周细胞质条带上,也会产生一些问题。
对于这些挑战,有一些可能的解决方案。例如,通常用于叶或根组织的方法是应用低温兼容的包埋介质来封装植物结构。包埋介质提供了一个固体基质,以提供支持并改善切割性能。因此,在冷冻切片前,在标本上再涂上一层薄薄的这种包埋介质,将更好地保持形态,提高切片质量。酶学的改进也可以促进细胞壁的去除。
成像是空间转录组学的关键部分。在最简单的形式中,植物细胞壁和边界可以在未染色的样品中使用standard brightfifield light optics进行划定,或者使用甲苯胺蓝或苏木精和伊红等染色剂进一步增强。可以利用自发荧光(即叶绿体或细胞壁)来提供位置信息或表明细胞类型或状态。此外,成像可以有效地用于评估切片的质量和目标的保留。在cDNA合成过程中,可以通过加入荧光核苷酸来评估植物材料的释放情况。成像也可用于可视化通过荧光标记的探针杂交而标记的阵列点。理想情况下,对于3D转录组学,每个成像序列部分都必须“注册”到其相应的“地址”。 优化上游样品和切片的质量将大大有助于下游数据处理和可视化。
空间转录组学技术的一个优势是能够使用条形码寡核苷酸探针从新鲜冷冻组织中捕获RNA。如前所述,从植物细胞中释放mRNA由于物理屏障——细胞壁而增加了难度。因此,必须使用一种专门水解细胞壁成分的酶混合物。然而,植物也具有次级代谢产物,可以与释放的mRNA形成复合物。这一点,再加上需要苛刻的酶来打破细胞壁,可能会限制RNA捕获的效率。虽然这可以通过添加化学品(即聚1-乙烯基吡咯烷酮-2)来克服,另一个潜在的解决方案是迫使释放的转录本立即下滑至玻片表面,在那里它们可以被oligo探针捕获,也许通过电泳,以提高RNA捕获效率。这种方法与植物组织打印方法类似。然而,要使这一理论方法在实践中取得成功,还需要对实验流程作进一步改进。
单细胞方法的一个主要步骤是数据处理,这涉及将reads映射回细胞,并根据这些reads确定细胞的类型。对于空间转录组数据,其一般流程为:对空间条码的配对reads进行去卷积,将cDNA reads映射到参考基因转录本,最后创建一个基因表达列表,列代表空间点,行代表基因。
获得基因表达列表的下一步是基于跨细胞或空间位置的基因表达谱对数据进行聚类。这确定了具有类似表达趋势的细胞类型或区域的亚群。然而,scRNA-seq或空间数据所特有的挑战可能会严重影响聚类和下游功能表征。其中一个挑战是固有噪声。从计算的角度来看,空间数据中的技术噪声源于“空间丢失”(捕获效率较低的点,分辨率较高),覆盖部分细胞的点与覆盖多个细胞的点之间的内在差异,高表达核糖体基因或线粒体RNA的点,测序深度的变化和实验批次效应。生物噪声源于瞬时细胞状态、细胞周期变化和细胞异质性。
解决这一问题的一种方法是对数据中的技术差异进行建模,并建立阈值,以去除RNA含量极低或非常高的细胞或spots,以及线粒体/核糖体基因百分比较高的细胞或spots。另一种降低噪声的方法是通过将每个点的基因表达值与其相邻点的基因表达值平均来平滑每个点的基因表达值。R或python软件包,如Seurat、Scanpy和Scater已被开发出来,特别用于分析大规模的scRNA-seq数据,并提供去除固有噪声的工具,它们也可应用于高分辨率的空间转录组学数据。
一些聚类策略已被广泛用于分析包括植物研究在内的scRNA-seq数据。t-SNE和UMAP是用于scRNA-seq数据非线性降维和聚类的两种最常用的技术。在高分辨率空间RNA-seq数据的情况下,可以类似地进行空间特征的无监督聚类(如分离的单个细胞),然后将聚类与组织中的空间区域相关联。Seurat v3 R软件包中提供了一些用于降维和聚类的计算方法,并支持空间转录组学数据。
空间转录组学的主要优势是能够在植物组织切片的二维空间轮廓内实现基因表达动态的可视化。三维空间的可视化可以通过堆叠多个二维组织切片来实现。这就需要将由X-Y-Z坐标定义的阵列点的基因表达数据与基于显微镜的植物组织的三维阵列成像相关联。关联本身可以使用成像软件(如Adobe Photoshop)手动完成,或者使用ST Spot Detector,这是一个专门为分析空间转录组学成像数据而开发的计算工具。计算工具如ST viewer,也可以帮助这些可视化;Trendsceek可识别重要基因的空间表达趋势;Novoparc等计算方法试图从分离的scRNA-seq数据中重建新的空间定位。然而,以上讨论的大多数方法目前已知是针对二维空间数据,将需要扩展和改进,以分析单细胞分辨率下三维空间的空间转录组学数据。
参考文献
Gurazada SGR, Cox KL, Czymmek KJ, Meyers BC. Space: the final frontier - achieving single-cell, spatially resolved transcriptomics in plants. Emerg Top Life Sci. 2021 May 21;5(2):179-188. doi: 10.1042/ETLS20200274. PMID: 33522561.
图片均来源于Emerg Top Life Sci.和参考文献,如有侵权请联系删除。