Nature 子刊:CRISPR Cas9/gRNA复合物的活性主要取决于特定的自由结合能范围和目标 PAM 环境

2023-01-11 822CNGBdb

2022年5月,深圳华大生命科学研究院、青岛华大、青欧生命科学高等研究院Lars再生医学研究所罗永伦教授团队与丹麦哥本哈根大学Jan Gorodkin教授团队在Nature Communications杂志在线发表“CRISPR/Cas9 gRNA activity depends on free energy changes and on the target PAM context”的研究论文,报道了CRISPR Cas9/gRNA复合物在PAM周围的局部滑动对靶DNA特异性切割的重要影响。

CRISPR Cas9/gRNA-1.png

此项研究的原始测序数据已存储于国家基因库生命大数据平台(CNGBdb),项目编号为:CNP0001874

研究背景

CRISPR-Cas9是目前最为强大的基因组编辑工具,目前已广泛应用于生物、农业和医学研究领域。被广泛研究的化脓性链球菌的SpCas9是由引导 RNA (gRNA) 的 20 nt 片段介导,gRNA与原型间隔区相邻基序 (PAM) 之前的目标 DNA 序列互补,然后spCas9募集到靶位点完成切割。SpCas9 的标准 PAM 是 5'-NGG-3’。目前gRNA设计的一个主要挑战是如何快速找到高特异性且高效率的gRNA。尽管已经有很多gRNA设计工具,但都是基于gRNA序列和结构特性,而把gRNA-DNA结合模式、结合能变化和gRNA展开的自由能变化与切割效率结合起来的分析仍然缺乏,且对CRISPR/Cas9如何调节靶向性和特异性的理解仍然不完整。

研究内容

本文基于能量模型 (EBM) 确定了一个最佳的gRNA-DNA结合自由能变化范围(sweet spot range of binding free energy change),这很大程度上解释gRNA的on-target和off-target的效率变化,同时也能解释为什么有些gRNA在off-target的切割效率高于on-target。这主要是Cas9 在PAMs上的“滑动”会产生局部的 gRNA-DNA 相互作用,从而对gRNA活性产生深远的影响。所以如果能将Cas9在PAM 周围的局部滑动与其在全基因组范围的脱靶相结合,会有助于我们设计出高特异性且高效率的gRNA。本研究中挖掘了大量的公共数据并结合青欧研究院团队建立的Surro-seq技术[1]得到的数据,验证了Cas9 在PAMs上的“滑动”现象对gRNA效率的影响。并为Cas9-PAM 相容性对切割激活机制的影响提供了证据,强调了考虑Cas9局部滑动因素在gRNA 设计中的重要性。

用gRNA-DNA的结合自由能变化对Cas9 靶向效率进行建模

gRNA-DNA 的结合能变化可用于评估具有错配(Mismatch)或凸起 (Bulge) gRNA脱靶效率。因为只有gRNA-DNA的拥有足够的配对结合后才能激发Cas9的构象变化使其对目标位点进行切割。为了测试gRNA-DNA结合能的变化对基因编辑效率的影响,本文建立的CRISPR/Cas9 自由能模型为:

CRISPR Cas9/gRNA-2.png

ΔGH 是gRNA-DNA 杂交自由能变化,一般高效 gRNAs 的 ΔGH主要局限的最佳能量范围是在 -64.53 和 -47.09 kcal/mol 之间。在低效gRNA中我们会观察到更加极端的ΔGH,同时我们发现,与 GC 含量的关系相比,ΔGH 与切割效率的关系更为“紧密”(尽管这两种性质之间存在高度相关性) 。ΔGO 是目标DNA双链解开的自由能变化,该能量越高越不利于gRNA-DNA的互补结合。ΔGU 表示gRNA 自身折叠的自由能变化(越稳定的 gRNA 折叠结构反而会对切割活性产生负面影响)。ΔGB 结合自由能变化是结合了 ΔGH、ΔGO 和 ΔGU 的一种综合自由能变化。ΔGB 在低效和高效 gRNA 之间存在显著差异,高效的gRNA在与靶标DNA结合的过程中的自由能变化较小。通过建模发现sgRNA-DNA的相互作用和杂交结合能在Cas9 切割激活中具有重要作用。

CRISPR Cas9/gRNA-3.png

较低的gRNA-DNA杂交自由能变化会导致脱靶活性增加

文章同时用ΔGH 的最佳能量范围模型解释了为什么有的gRNA的off-target效率高于 on-target效率。通过分析Tsai 等GUIDE-seq的gRNA off-target数据,该数据集中 GC 含量最高的4个gRNA (67-80%) 的off-target效率高于其on-target的效率。在 4 个on-target位点中,其中3 个的 ΔGH 在优先能量范围内,而与on-target相比效率更高的所有 4 个脱靶位点的ΔGH 都处在最佳能量(sweet spot)范围内。相反在所有的off-target效率低于on-target的18个脱靶位点,由于 ΔGH 增加,所有脱靶位点的ΔGH 都不在最佳能量范围内。值得注意的是,这些脱靶位点的效率不能通过与目标位点匹配的碱基的GC含量来解释。这表明ΔGH 在评估 gRNA-DNA 结合方面具有重大优势。这些结果表明,最佳能量范围亲和力(sweet spot affinity)是定义完全互补的gRNA on-target的切割效率的合适标准,而最佳能量范围能解释为什么有些gRNA在脱靶位点的编辑效率会高于on-target的效率。

CRISPR Cas9/gRNA-4.png

CRISPR/Cas9在经典PAM(NGG)上的局部滑动影响切割效率

基于以上结论,文章进一步设计了一个能量模型来解释 Cas9 在与目标 PAM 重叠的GG位点(不是真正的目标PAM)的切割活性。当gRNA的 PAM 近端的第一个核苷酸上的凸起形成部分gRNA-DNA 相互作用时,Cas9 可以与并列的上游 PAM 结合,并自发滑向预期的目标 PAM,以最大限度地提高gRNA-DNA 互补性并提高稳定性。相反,当gRNA-DNA 杂合体在 PAM近端有一个 DNA 凸起时,Cas9可以在下游 PAM 处结合将复合物锚定在次优配置中,因此Cas9复合物在此处的结合可能也具有切割活性。与该模型一致的是,先前的研究表明,紧邻目标 PAM 下游的鸟嘌呤G的存在会降低目标位点的切割效率。

在Xiang 等[1]研究自由能变化特性(11,602个gRNA)影响gRNA效率的数据集中发现,与具有非重叠 PAM 的目标位点的编辑效率相比,具有下游 PAM(DNA 凸起)的目标位点的编辑效率比平均效率低 12.64% 。相反的是,具有上游 PAM(gRNA 凸起)的目标位点的平均编辑效率提高了7.24%。而同时具有下游和上游滑动 PAM 的目标位点的平均编辑效率下降 3.96%。这些观察结果表明,Cas9 结合位点的序列背景显著影响 gRNA 效率。

因此,将可以将gRNA在PAM处的局部滑动的凸起相互作用视为伪脱靶。这里扩展了脱靶评分来解释gRNA在PAM 处的局部滑动如何影响 gRNA 结合竞争。因此把gRNA在PAM上游和下游的局部滑动特征加入到以前定义的CRISPRspec 全局 gRNA 特异性评分中,来帮助研究者选择特异性更高的gRNA。在CRISPRspec 得分越高,结合竞争(脱靶)对 gRNA 的影响就越小。一般来说,分数高于 5 的gRNA被认为是具有低脱靶潜力的gRNA。

为了测试加入局部滑动 PAM 特征是否可以提高 CRISPRspec,在添加局部滑动PAM之前和之后,文章分析了两个独立的数据集的 CRISPRspec 和 gRNA 效率之间的关系。在测试数据集中仅考虑了含有上下游滑动PAM的gRNA,按照CRISPRspec和CRISPRspecExt分数分为low, medium和high 3组。在“Xiang 2021 ” 的数据集[1]中,通过 CRISPRspec 分组的medium和 high 组的gRNA 的效率没有显著差异。而通过CRISPRspecExt的分组,所有三组之间的效率都具有显著差异。在 “Hart 2015 ”的数据集中再次证明,与CRISPRspec相比CRISPRspecExt能更好的区分不同编辑效率的gRNA。以上分析表明,CRISPRspecExt可以很好地分离出高度特异的、高编辑效率的 gRNA。

CRISPR Cas9/gRNA-5.png

在HEK293T细胞系中验证经典(canonical)PAM 上的局部滑动效应

从上面的分析中可以看出,目标 PAM 结合位点的上下游序列会影响gRNA的效率。为了进一步验证这种现象,文章检测了能分别靶向 PAX5、BMP3、ADRA2C 和 CHRNB2 这四个基因的4条gRNA在不同PAM处的基因编辑效率。对于每个 gRNA的靶向位点的PAM设计为5'-N-1GGN+1-3' (PAM 中所有可能的 16 种 N-1 和 N+1 变体)以用来测试PAM上下游序列对gRNA切割效率的影响。与上面介绍的局部 PAM 滑动模型一致,与具有 H-1GGH+1 PAM的位点相比,具有G-1GGH+1 和 H-1GGG+1 PAM 的靶标处的切割平均效率分别增加和减少 11.31% 和 12.13%(其中 H 表示 A、T 或 C)。基于 N-1N+1的聚类发现4个gRNA 中平均效率最高的前3个为G-1H+1,而平均效率最低的3个是H-1G+1。如果不考虑PAM的局部滑动,则 gRNA在PAM的上下游序列的CRISPRspe是不变的。相比之下,在添加了PAM局部滑动后,发现CRISPRspecExt与gRNA的编辑效率呈正相关。因此,基于能量结合模型允许我们根据gRNA的目标背景序列的识别,鉴定出高度特异性和高效率的gRNA。

CRISPR Cas9/gRNA-6.png

研究结论

在这项工作中, CRISPR/Cas9 靶向切割被描述为一种能量驱动的过程,其切割效率很大程度上取决于gRNA-DNA结合能以及gRNA自身折叠能的变化。同时对高效和低效 gRNA 的自由能变化偏好的分析强调了设计gRNA时需要考虑gRNA自身折叠能、gRNA-DNA杂交能变化以及其在种子区域 牢固结合的重要性。

关于是否可以在平衡状态下模拟Cas9和靶位点的结合,目前仍旧处于讨论的阶段,而本文证明了其可行性。最重要的是 gRNA-DNA 结合杂交自由能sweet spot模型为先前在RNA bulge和DNA bulge处的脱靶位点活性高于其on-target活性供了解释。虽然本文的研究集中在 Cas9-gRNA 相互作用上,但文中描述的概念可以广泛应用于其他 RNA 引导的复合物。总之,Cas9 结合位点的局部环境会强烈影响 Cas9 结合和切割效率,这在很大程度上可以通过结合能模型来解释。另外,一旦考虑到局部滑动 PAM,gRNA 特异性的评估就会得到增强,这有助于识别具有更高特异性和高效率的gRNA。

哥本哈根大学Giulia I. Corsi博士和青欧在读博士生渠坤丽为本研究共同第一作者。青欧生命科学高等研究院于2019年9月注册成立,坐落于青岛自贸片区·中德生态园,依托青岛市西海岸新区、青岛中德生态园、深圳华大生命科学研究院、青岛华大基因研究院成立。 青欧生命科学高等研究院已建立CRISPR基因编辑、宏基因组单细胞分选、染色体外环状DNA、单细胞多组学研究等多层次科研平台。已在包括《科学》《细胞》在内学术期刊发表论文30余篇。青欧研究院正与丹麦哥本哈根大学、奥胡斯大学和瑞典卡罗林斯卡医学院等国际院校合作,聚焦博士人才培养、科学与技术探索、前沿技术产业转化,旨在打造一个国际化、开放型、集科研、教育、孵化于一体的国际化综合性平台。

参考文献:[1] Xiang X, Corsi G I, Anthon C, et al. Enhancing CRISPR-Cas9 gRNA efficiency prediction by data integration and deep learning[J]. Nature communications, 2021, 12(1): 1-9.[2] Corsi, G.I., Qu, K., Alkan, F. et al. CRISPR/Cas9 gRNA activity depends on free energy changes and on the target PAM context. Nat Commun 13, 3006 (2022).
信息来源:“青欧生命科学高等研究院”公众号

上一篇下一篇

相关专题