Trends in Genetics | 单细胞多组学技术进展

2022-08-15 665文献解读

小编分享一篇今年5月发表在Trends in Genetics的综述文章,复习一下单细胞多组学技术的基础知识。

单细胞多组学技术进展-1.png

单细胞转录组学彻底改变了复杂生物系统的研究,通过对数千个细胞中基因表达的常规测量,可以构建整个生物体的细胞图谱。然而,转录组只是众多调控定义细胞类型和状态以及最终功能的其中一个环节。随着scRNA-seq的广泛应用,同时快速出现了多种方法,可以对单个细胞进行多组学分析,平行检测基因组、表观组、转录组和蛋白质组中的细胞间异质性。将这些检测结果联系起来,有可能揭示健康发育和疾病中细胞行为的调控和功能机制。

单细胞多组学技术进展-2.png

单细胞多组学技术进展

单细胞多组学技术进展-3.png

将体细胞变异和基因表达联系起来

将体细胞变异与同一细胞中的基因表达联系起来对于理解获得性突变的功能后果以及这些突变如何引入功能性细胞异质性至关重要。早期的单细胞多组学方法,如DR-seq(gDNA和mRNA测序)和G&T-seq(基因组和转录组测序),对单个细胞的基因组和转录组进行平行分析,通常是手动或通过FACS分离。这两种plate-based的方法都能够在基因组变异(从染色体拷贝数到单核苷酸分辨率)和基因表达之间建立联系。他们还首次证明了染色体拷贝数对同一细胞中基因表达的直接影响,拷贝数和基因表达之间存在明显的相关性。然而这些方法也存在成本高、通量低、扩增引入错误等限制。

最近开发的Target-seq实现了同一单个细胞的平行mRNA序列和靶向基因分型。plate-based的方案具有Smart-seq2 mRNA扩增的优化版本,之后将样品拆分,并使用靶向转录组和/或基因组内感兴趣区域的引物生成靶向扩增子测序文库。通过关注已知突变,这种方法显著提高了灵敏度并降低了突变检测的成本。这些靶向方法与已知突变库普遍存在的研究高度相关,如肿瘤内异质性和癌症演变的研究,其中复发性突变很常见。然而,在复杂的突变背景下,或者突变发现很重要的地方,批量或单细胞全基因组测序可能仍然更适用。

涉及细胞核和细胞质的物理分离的方法也已被证明,“基因组DNA和总RNA的同时分离”(SIDR)是第一个此类方法。这种方法极大地提高了DNTR-seq的通量。然而,与其他需要物理分离细胞核和细胞质的方法一样,目前尚不清楚它们在有丝分裂细胞周期中如何受到核膜解体的影响。

将表观基因组和基因表达联系起来

第一种试图将表观遗传多样性与单细胞转录异质性联系起来的方法集中于CpG位点的DNA甲基化与基因表达之间的关联。scM&T-seq(单细胞甲基化和转录组测序)基于G&T-seq方法,但使用纯化的基因组DNA进行改良的PBAT方案,生成全基因组甲基化数据,同时再次使用改良的Smart-seq2方案对转录组进行测序。该方法首次应用于小鼠胚胎干细胞,以发现远端调控元件的DNA甲基化异质性与数百个基因(包括关键多能性基因)表达之间的新相关性。其他涉及细胞核和细胞质物理分离的方法已用于从同一单个细胞获得基因表达和DNA甲基化数据,包括MT-seq和scTRIO-seq。

在单细胞中检测DNA甲基化仍然存在重大限制——亚硫酸氢盐处理会破坏DNA,导致高水平的等位基因和位点缺失。最近,epi-gSCAR方法证明了无亚硫酸氢盐单细胞文库制备的可行性——使用甲基化敏感限制性内切酶HhaI和准线性扩增——以研究癌症细胞系中单核苷酸分辨率的全基因组甲基化和基因组变异。

基因组内序列的可及性被认为是基因组活动的标志,代表特定基因的表达或特定序列的开放性,包括增强子或转录因子结合位点。单细胞中的染色质可及性现在通过使用ATAC-seq进行常规检测。一般而言,这些高通量方法依赖于通过组合索引或基于液滴的方法,在同一细胞标记的DNA和RNA配对条形码之前,在核的批量制备中标记可访问的染色质,例如sciCAR-seq使用组合索引法,每次实验处理超过11000个细胞核。也有研究者描述了使用完整细胞而不是细胞核的中通量方法(scCAT-seq和ASTAR-seq),可能更适用于需要分析稀有细胞的实验。

此外,单核染色质可及性和mRNA表达测序(SNARE-seq)利用微流控Drop-seq方法,对同一核进行平行的染色质可及性和基因表达检测。最近也开发出单核多组学分析的替代方法,即ISSAAC-seq。

将表观基因组的不同方面联系起来

ATAC-seq只能提供可及的染色质的序列信息,不能捕捉到与异染色质相关的遗传改变和染色质重塑事件。最近,通过scGET-seq分析将染色质可及性分析与单细胞基因组和表观基因组中的异染色质采样相结合。在单细胞基因组学中引入工程转座酶,为表观基因组中其他领域的定向分析释放了巨大的潜力。一种名为scCUT&Tag2for1的类似方法,是对标准CUT&Tag的改进,通过靶向RNA聚合酶II的起始形式和抑制性Polycomb结构域(H3K27me3),使用抗体引导的标记来同时描述可及和沉默的调控组。进一步的CUT&Tag开发即scCUT&Tag-pro,允许在全细胞上同时分析组蛋白修饰和蛋白质丰度。

染色质构象分析,如Hi-C,揭示了基因组三维构象在健康、疾病和衰老中调节基因表达的程度。两种多组学方法,single-nucleus methyl-3C和scMethyl-HiC,描述了使用亚硫酸氢盐转化交联基因组DNA从同一单细胞中获得关联染色质构象和甲基化数据的方法。这些方法表明,仅染色质构象就可以识别异质群体中的细胞类型,以及与人脑细胞中细胞类型特异性染色质相互作用相关的差异甲基化特征。

将转录组和蛋白组联系起来

PLAYR通过使用质谱仪检测转录本和蛋白质,其扩展了邻近连接(PLA)方法的通量,从而能够在数千个细胞中平行测量40多种不同转录本和蛋白表位。最近SPARC方法,其中mRNA和蛋白质裂解液是物理分离的,可以使用邻近延伸分析(PEA)技术平行进行全转录组mRNA-seq和检测细胞内/外蛋白质。

通过将寡核苷酸结合抗体与基于液滴的微流控(例如10X Genomics)和微孔平台(例如BD Rhapsody)相结合,实现了通量的增加,这种方法在REAP-seq和CITE-seq中是首创。在这些方法中,细胞用一组抗体标记,每个抗体用一个特定的多聚腺苷酸化条形码标记,该条形码可以在裂解后与同一细胞的mRNA平行捕获。SCITO-seq展示了抗体条形码的组合索引方法,实现了细胞的极端多重化,以及150多种表面蛋白的多模式分析,与来自相同细胞的mRNA表达检测平行进行。

基于抗体的方法受到抗原特异性试剂可用性的严重限制——检测需要可靠的表位特异性抗体(或用于基于PEA的分析的一对抗体),这会显著减少可检测的蛋白质或表位的数量。为了获得更完整的细胞蛋白质组信息,抗体无关的方法是必不可少的。基于单细胞质谱的方法,如SCoPE-MS和SCoPE2,可以分析单个细胞中的数千种蛋白质和翻译后修饰;然而,它们还没有被直接纳入综合多组学方法。最近,PHAGE-ATAC assay证明了一种替代方法,即用纳米体噬菌体展示库代替抗体。这可能提供一种无需抗体的蛋白质检测的潜在途径。

三阶和更高阶的单细胞多组学

为了充分探索细胞间异质性的因果,同时从尽可能多的细胞方面获取数据非常重要。作为一个早期的例子,scTRIO-seq可以同时检测同一细胞在~10 Mb分辨率下的基因组拷贝数变化、DNA甲基化和基因表达。scNMT-seq技术将scNOMe-Seq和plate-based的G&T-seq改进相结合允许平行测量核小体定位、DNA甲基化和细胞转录组,与其相似的方法还有scChaRM-seq。NOME-seq方法被进一步调整为scCOOL-seq,它可以平行检测细胞的各种基因组方面,包括染色质状态、核糖体定位、DNA甲基化、CNV和染色体倍性。该方法经过改进,将转录组测量纳入iscCOOL-seq中。

在微流控工作流程的基础上,ASAP-seq展示了平行进行的染色质可及性、细胞表面和细胞内蛋白质测量。此外,该方法能够对线粒体基因组进行突变分析,允许同时从线粒体突变中进行系谱推断。其被扩展后的技术成为DOGMA-seq,纳入了RNA-seq检测。最近还描述了一种类似的方法TEA-seq。在这些研究中,分析的是整个细胞而不是细胞核,其优点是允许更全面的表型特征,在分析前进行表面标记物富集,并在多模式测定中保留细胞质RNA。

通过捕捉这些多层次的信息,可以以前所未有的细节剖析分化的表观遗传决定因素及其动态——可及性和甲基化的变化可以与基因和蛋白质表达水平的变化直接相关。这将有助于构建全基因组调控模型,将细胞作为基因组调控和基因表达的单位。

现在可以通过接近“全序列”的新方法来分析数千个单个细胞的多个分子层,其中多个组学检测可以与基于空间和谱系的信息相结合,在单个序列读取中确定细胞的分子状态、微环境和生活史。这对当前和未来的发育和癌症生物学研究具有重要意义,其中单个细胞的变化是健康发育或疾病进展的基础。这些方法,特别是当与使用CRISPR/Cas系统的扰动相结合时,将具有巨大的潜力来揭示细胞(外显)基因型/表型关联以及控制细胞异质性出现的机制。

然而,仍有一些挑战。目前,每个分子水平的分析都是不完善的--任何类型的单细胞检测都容易产生噪音,特别是丢失,其中突变、修饰或表达的关键信号可能会丢失。当方法扩展到包括数千甚至数百万个细胞时,每个细胞的细节也会随之丢失。虽然方法的未来发展将纳入更多的组学检测--包括扩大的蛋白质组和代谢组分析--但仍然需要完善现有方法,以获得高分辨率、精确的基准水平事件的检测,以及对单个细胞的基因和异构体表达灵敏、定量的测量。

除了细胞的大分子成分外,还有许多代谢物可以对细胞功能的调节起作用,对它们进行测量的新方法正在出现。没有细胞是孤立存在的--除了分子分析之外,细胞的生活史及其与其他细胞的空间关系是决定细胞身份的关键因素。毫无疑问,细胞谱系追踪和空间转录组学的巨大进步将与多组学分析相融合,从而能够在细胞身份的位置和它来自哪里的背景下全面分析细胞身份,但这将带来额外、复杂的计算和数据科学挑战。不同的数据类型,每一个都有自己的特异性。Seurat和MOFA+等软件包可以实现单细胞多组学实验的数据整合,后者旨在识别scNMT-seq数据中的细胞分类因素和调控依赖。继续开发超越细胞类型分类的计算工具,并能推断出跨越多层的调控网络,对于未来的单细胞多组学研究至关重要。

由于篇幅有限,更多技术细节可参考文献原文 :https://doi.org/10.1016/j.tig.2022.03.015

上一篇下一篇