2021-03-25 2837文献解读
胚胎发育和干细胞分化为理解协调细胞命运决定的分子调控和组织模式的构建提供了范例。
单细胞转录组测序(scRNA-seq)和空间转录组学等新兴技术为分析细胞组织、形态和分子特性的分化以及系谱分配开辟了新途径。
scRNA-seq数据的降维分析
与bulkRNA-seq相比,scRNA-seq在细胞数量和基因表达的复杂性方面都具有更高的维度。因此,降维和可视化是scRNA-seq数据分析的主要任务。目前主流的降维方法有:1)PCA(Principle Component Analysis),主成分分析,是一种线性的降维方法。利用PCA对数据进行快速分析,识别具有相似基因表达谱的细胞簇,可以揭示数据结构的基本特征,并对样本覆盖率或批量推断进行粗略评估。2)t-SNE(T-distributed stochastic neighbor embedding),是一种非线性的降维方法,它趋向于保留局部结构。UMAP(uniform manifold approximation and projection)结合了t-SNE和PCA的特征,除了保留全局结构外,还提供了数据的具体可视化。降维仍然是一个快速发展的研究领域,一个新兴的趋势是机器学习或深度学习方法的参与,这些方法被用来建模和估计数据分布。
利用scRNA-seq的轨迹分析
除了对单个细胞进行聚类、识别细胞类型异质性、揭示主要细胞类型差异基因表达变化外,破译单个细胞的进展状态对揭示细胞决策具有重要意义。scRNA-seq轨迹推断,可获得谱系信息而不依赖于细胞之间的遗传互作关系:即使细胞仅在固定的时间点被取样,也可以对其发育轨迹进行一定程度的预测。目前已经有多位学者开发了计算工具,例如 Monocle,SCORPIUS,Slingshot等。但是值得注意的是,即使有多种方法和工具供我们推断轨迹,没有一种方法和工具能适用所有情况。在处理不同的数据集和考虑到生物轨迹的综合复杂性时,应测试不同的方法。
利用胚胎发育过程中scRNA-seq数据推断细胞谱系
单细胞数据凸显了细胞表型的连续性,提供一个概率框架描述细胞的命运决定,并能绘制所有基因相似的细胞之间的过渡路径和中间状态。最近的一些研究利用系统化的单细胞转录组来构建系谱树,例如利用Drop-seq对大量单细胞进行了高时间分辨率的测序,以揭示斑马鱼胚胎发生过程中的转录轨迹。然而干细胞的分化命运并非只是简单线性的,其路径具有多种复杂的结构,目前的轨迹推断方法仍有限制,需要改进实验和计算方法来用于复杂的发育轨迹。
将scRNA-seq与系谱追踪相结合
发育生物学和干细胞生物学的核心问题之一是受精卵如何发育成各种细胞类型。利用转录组上单细胞的静态连续变化来解释单个细胞的动态发育轨迹具有很大的局限性,通过TracerSeq、CRISPR/ cas9等技术引入基因组barcode进行遗传标记追踪,与scRNA-seq结合,同时获得谱系变化与分子特征,为追踪生物体谱系提供了强大助力。
scRNA-seq揭示基因调控网络
将scRNA-seq所揭示的不同表达方式的信息与细胞的发育轨迹进行耦合,可以描述细胞的层次结构或中间状态,揭示转录调控机制。为此,人们开发了多种利用单细胞数据推断基因调控网络的计算和实验方法。
空间转录组分析正在快速发展,整合基因表达和空间信息的传统手段依赖于原位杂交。空间转录组信息可以通过直接或者间接的方式获得。
直接空间转录组分析
在直接获取空间信息的方面,研究人员开发了seqFISH,可以同时检测上百个基因的原位杂交信号,大大的提高了研究的通量。同样MERFISH技术利用额外的光谱信息,即靶向序列和读出序列的组合,在单细胞中实现高水平的复用。通过纠错解码算法,可以进一步提高检测精度。此外,Spatial Transcriptomics (ST) 通过将大脑切片覆盖在连接有锚定引物的矩阵芯片上(Array),原位消化细胞使得细胞通透性增大,释放细胞中的mRNA,直接与锚定引物结合,进行原位反转扩增,可得到具有空间位置信息的转录组数据;基于ST类似的方法例如Slide-seq,HDST分别在分辨率和通量上进行了改进。Geographical position sequencing(Geo-seq)通过激光显微切割以及scRNA-seq的结合,具有很高的基因检测效率和空间位置保存的优点。但需要注意的是,空间转录组学还处于持续和快速发展的不成熟阶段,符合高分辨率以及高通量的空间转录组学方案及相应的计算分析策略仍有待开发。
间接空间转录组分析
除了利用直接原位单细胞空间测序技术外,还可以利用已获得的空间位置组学数据,提取空间位置参考坐标系,恢复单个细胞的空间位置,间接提高空间转录组对单个细胞的分辨率。例如研究人员开发了Seurat,该算法通过比较每个转录组中表达的基因与从RNA原位杂交获得的几个标志性基因的空间表达模式来推断单细胞转录组的空间位置。但由于具有位置信息的参考坐标基因数量有限,并且单细胞中表达这些位置参考基因时出现一部分基因表达缺失,使得空间定位的成功率大大下降。与此相似,研究人员开发了另外一种算法,基于一部分具有原位杂交信息的位置参考基因并计算这些位置参考基因在每个细胞中的特异性评分,结合每个细胞与参考位置分区中的相关性系数,来赋予单个细胞最为可能的位置关系。目前获取必要的位置参考基因的方法仍在起步阶段,期待计算机算法的创新研发。利用机器学习程序对大型空间转录组数据集进行分析探测,可以更有效地识别空间信息的隐藏层。
哺乳动物胚胎的发育具有细胞分化和组织模式形成的调节模式,使其能够在时间和空间分辨率上进行细胞命运决定的定量分析。与着床前胚胎只有少量细胞进行多能性转化不同,原肠运动过程是外、中、内三个胚层的形成过程,伴随着剧烈的细胞增殖和细胞迁移,之后特化的胚层进而发育成形态功能各异的器官组织。因此,原肠运动是决定各个胚层形成以及细胞命运图谱最为关键的一个生物学过程。目前,已有多项研究使用单细胞及空间组学技术记录原肠胚形成过程的分子动态信息,例如其中一项研究在原肠胚形成的关键发育阶段获得了时空转录组活性的整体信息;另一项研究利用10X genomics收集了116312个处于移植后发育阶段的单细胞。以期解析从原肠期到早期器官形成的细胞分化图谱。基于空间组学与单细胞组学的整合分析,提供了内胚层起始的细胞命运的分歧和统一新视角,为传统命运图谱研究补充了新的生物学证据。
在新兴的技术中,单细胞分析和空间转录组分析为描述早期发育过程中细胞谱系的起源和轨迹提供了有效的工具。这些技术结合单细胞成像追踪和对胚胎发育过程中单个细胞位置的了解,可以全面揭示细胞运动、信号转导通路、转录因子和基因组染色质包装之间的相互作用,从而确定每种细胞类型的谱系。
人类胚胎研究的伦理和法律约束意味着人类早期胚胎发育过程中的谱系决定研究主要集中在植入前胚胎,同时也将部分目光转向了体外人类胚胎和非人灵长类胚胎的研究中。比较非人类灵长类和小鼠的原肠期研究,以及体内体外实验模型的相关性,揭示原肠期发育过程中的分子结构和谱系特征将成为胚胎发育研究中的一个极其重要的课题。
参考文献
Peng G, Cui G, Ke J, et al. Using single-cell and spatial transcriptomes to understand stem cell lineage specification during early embryo development[J]. Annual review of genomics and human genetics, 2020, 21: 163-181.
图片均来源于参考文献,部分信息来源于“中科院广州生物医药与健康研究院”公众号,如有侵权请联系删除。