单细胞DNA甲基化研究基础篇:从实验策略到数据分析方法简介

2021-07-26 3014文献解读

DNA甲基化是细胞分裂过程中遗传的一种表观遗传标记,影响细胞的生物学功能。而单细胞水平上的全基因组甲基化分析将有助于深入了解转录调控和细胞异质性。

单细胞DNA甲基化研究怎么做?

来自韩国的科研人员在《Biomolecules》发表综述文章,介绍了单细胞DNA甲基化分析方法,包括实验策略和数据分析;此外,还介绍了相关科研应用并讨论了未来的发展。

单细胞DNA甲基化研究基础篇:从实验策略到数据分析方法简介-1.png

注:此篇综述没有介绍5mC分析方法,虽然介绍了许多多组学方法,但每种方法的单独分析过程未作深入讨论。

实验方法

单细胞DNA甲基化研究基础篇:从实验策略到数据分析方法简介-2.png

亚硫酸氢盐转化法

亚硫酸氢盐转化法被认为是DNA甲基化分析的金标准。由于它的高转化率(>99%)、可重复性和通过商业试剂盒的简单易用性而受到研究人员的青睐。然而,亚硫酸氢盐转化法采用了导致DNA降解的苛刻反应条件,PBAT的开发即是为了解决降解造成的损失问题。

单细胞DNA甲基化研究基础篇:从实验策略到数据分析方法简介-3.png

RRBS和WGBS是流行的全基因组甲基化分析方法。 这两种方法都包括亚硫酸氢盐转化和NGS制备。主要区别在于,RRBS使用适当的限制性内切酶和大小选择来筛选富含GC的区域。WGBS(特别是MethylC-seq)的优势在于能够覆盖基因组中的大部分CpGs。与RRBS相比,WGBS的纯化和筛选过程相对简单。在WGBS中防止亚硫酸氢盐转化过程中的降解损失被认为是相对重要的,因此许多基于WGBS的单细胞方法往往是基于PBAT的。

单细胞DNA甲基化研究基础篇:从实验策略到数据分析方法简介-4.png

多组学方法是根据甲基化分析方法与其他分析方法(RNA、染色质可及性)相结合来区分的。例如scM&T-seq是基因组和转录组测序(G&T-seq)与scBS-seq的结合,G&T-seq是一种基于Smart-seq2识别DNA和RNA的方法。此外,应用于单细胞甲基化分析方法的技术,如PBAT,也可以类似地应用于NOME-seq,NOMe-seq可以根据核糖体的存在与否,利用GpC甲基转移酶的染色质可及性差异,确认双硫酸盐转化的DNA中开放染色质和CpG甲基化。scCOOL-seq、iscCOOL-seq和scNome-seq可以一起监测染色质可及性和CpG甲基化。

无转换的方法

通过转化以外的方法观察甲基化主要分为两类:利用甲基胞嘧啶的亲和结合和利用限制性内切酶对甲基胞嘧啶的敏感性。MBD-seq和MeDIP-seq是具有代表性的基于亲和性的方法。基于亲和力的方法不适合在单细胞规模上应用,因为这些方法基于DNA片段产生平均DNA甲基化谱,这不允许区分单个细胞中DNA甲基化模式的差异。然而,与基于亲和力的方法不同,基于MSRE的方法可以被改进,使用MSRE的单细胞方法的细化可以在Methyl-seq中看到,scCGI-seq测量甲基化的方式与Methyl-seq类似。

数据分析

单细胞DNA甲基化研究基础篇:从实验策略到数据分析方法简介-5.png

在测序实验之后,包括RRBS或WGBS,需要对数据进行预处理。预处理步骤可分为数据质控(QC)、序列修剪和比对,例如使用FastQC测量总体的基本测序数据质量,使用Trim Galore!、fastp和Trimmomatic等软件修剪,下表列出了常用的比对工具。

单细胞DNA甲基化研究基础篇:从实验策略到数据分析方法简介-6.png

甲基化分析的主要目的是探索构成样本、器官和疾病状态(包括癌症)之间差异的表观遗传学证据。为了发现这些差异,需要一个暗示此概念的数值,一个广泛使用的术语是β值。在甲基化调用后,进行后续分析,如可视化分析的t-SNE,聚类分析,以及识别差异甲基化胞嘧啶(DMCs)或差异甲基化区域(DMRs)

单细胞DNA甲基化研究基础篇:从实验策略到数据分析方法简介-7.png

上述方法主要依赖于单个CpG位点的甲基化水平。最近的甲基化分析利用了每个reads的甲基化模式来诊断疾病,尤其是癌症。这种新的分析概念是基于甲基化的生物学特性,即除非出现从头甲基化,否则相邻CpG位点之间有保持甲基化的趋势。该读取模式方法能够检测具有疾病信号的DNA分子,并且具有增加疾病信号检测机会的可能性。例如,一项大型液体活组织检测研究设计了一个集成分类器,根据读取模式分析对肿瘤类型进行分类,并在早期癌症的检测中显示出显著的结果。此外,通过甲基化模式对肿瘤衍生的DNA分子进行量化是观察肿瘤负担的另一种方法。

单细胞DNA甲基化研究基础篇:从实验策略到数据分析方法简介-8.png

应用

单细胞DNA甲基化研究基础篇:从实验策略到数据分析方法简介-9.png

细胞发育

生殖细胞或胚胎细胞的成熟受到特定基因表达的影响,这与DNA中的甲基化水平相关。例如基于植入前的胚胎细胞的甲基化特征,利用单细胞甲基化测序,通过对早期胚胎系追踪的研究,研究植入前细胞甲基化的机制及其现象。研究团队观察到非CpG甲基化在卵母细胞成熟过程中不断积累,说明非CpG甲基化与CpG甲基化在卵母细胞成熟过程中的作用不同。

与疾病相关的研究

在疾病患者中,DNA甲基化的模式与健康人不同。在各种疾病中,癌症尤其具有正常细胞所不具有的DNA甲基化模式,从而导致基因表达水平的差异。在对具有这种异质性的癌症研究中,需要使用多组学方法,将基因组变异和RNA表达结合起来进行分析。例如一个研究小组最近开发了一种称为scTrio-seq2的方法,它整合了单细胞转录组和单细胞甲基化测序数据。多项研究表明使用单细胞甲基化测序(sc-methyl-seq)的多组学方法可以克服先前方法的局限性,并且具有更好的鉴别能力。因此,sc-methyl-seq可用于各个领域,以解决与生物过程和疾病相关的基本问题。

单细胞DNA甲基化研究仍存在一些问题。其中第一个问题是亚硫酸氢盐转化的降解问题,这是目前的金标准。然而,在数量有限的单细胞尺度上,由于降解而造成的损失比在体积尺度上更严重。为了解决这个问题,采用了PBAT等技术,但其性能无法与使用大量DNA的方法相比。近年来,利用TET酶活性的方法,如TAPS和EM-seq,已经被开发出来,并作为一种解决慢性降解问题的方法而受到关注。另一个问题是一个明确的标准分析过程还没有建立。由于这些挑战,目前最好的方法是引入多组学方法进行交叉验证。

随着数据采集的成本正在逐渐降低和数据联盟的建立(例如国际人类表观基因组联盟(IHEC)等),全面数据的积累可以提供一个了解甲基化的机会。关于甲基化证据的积累将使大家有可能找到因不同组织类型、不同实验或环境条件以及异质性疾病(如癌症)而波动的甲基化热点区域。此外,通过积累的数据发现细胞类型的特异性标记,将有利于通过单细胞DNA甲基化数据的可视化来进行细胞异质性分析,包括在t-SNE图中分配细胞集群。相信对甲基化及其在疾病中的生物学作用之间关系的理解将随着未来进一步的数据而得到揭示。

参考文献
Ahn J, Heo S, Lee J, et al. Introduction to Single-Cell DNA Methylation Profiling Methods[J]. Biomolecules, 2021, 11(7): 1013.
图片均来源于参考文献,如有侵权请联系删除。

上一篇下一篇