2020-08-05 2183CNGBdb
2020年7月31日,国际著名期刊Science Advances杂志在线发表了深圳华大生命科学研究院的题为“DNB-based on-chip motif finding (DocMF):A high-throughput method to profile different types of protein-DNA interactions”(DocMF: 一种基于DNA纳米球技术的在芯片上高通量鉴定不同蛋白-DNA互作位点的平台)的研究论文。
目前研究蛋白质与DNA相互作用的靶向序列的方法有很多,常用的有微阵列技术(PBM:Protein-Binding Microarray)或者SELEX,但是这些方法通常费时费力且通量不够高。与这些技术相比,DocMF除了能检测出更多的蛋白和DNA结合位点,还能在DNA分子被蛋白切割后,大规模地提供有关与蛋白质相互作用的Motif信息。因此,DocMF是目前第一个能够同时鉴定蛋白切割位点以及蛋白与DNA靶向结合位点的高通量平台。
支持该研究结果的数据已保存在国家基因库生命大数据平台(CNGBdb),项目编号:CNP0000723
DocMF是一个以DNA纳米球(DNBSEQTM)技术为基础的,使用高通量测序芯片来分析蛋白质-DNA相互作用的高灵敏度、高通量的鉴定平台。
DocMF利用华大智造独有的DNBSEQTM测序技术和两次成像拍照结合的方法来检测蛋白质-DNA相互作用中所涉及的切割或者结合所需的特异性靶向序列。从单个DNB的序列信息和荧光信号变化,我们可以找到与蛋白质发生相互作用的所有序列,并通过生物信息学分析确定特定的靶向序列。测序芯片的通量可以允许一次性筛选十亿级别、带着不同序列的DNA纳米球,大大高于PBM或者SELEX的通量,DocMF能够很灵敏地找到弱结合力的所有互作位点序列。
使用该系统,研究团队成功地鉴定了常用核酸内切酶的识别位点(restriction sites),以及CRISPR/Cas蛋白特异性识别所需的PAM序列。
研究人员首先鉴定了不同类型的限制性内切核酸酶以及CRISPR/Cas的识别位点。最新基因编辑工具CRISPR/Cas系统是存在于多数细菌和古菌中的一种后天免疫系统,经生物学家改造后,可高效、便捷地实现基因定点修饰。此类Cas系统包含三个核心元件-Cas核酸酶,引导RNA(gRNA),间隔序列前体临近基序(protospacer adjacent motif,PAM)。PAM序列对Cas蛋白特异性识别靶序列至关重要,也是CRISPR/Cas系统发挥功效的关键特性之一。目前,现有的技术(E.coli双抗实验,Cas核酸酶切后高通量测序等),对PAM序列的鉴定仍存在不同的缺陷,如耗时长、灵敏度低等。利用DocMF,研究人员发现SpCas9除了经典的5’-NGG-3’的PAM外,还有两个较为少见的5’-NAG-3’和5’-NGA-3’的PAM序列,并且算出NAG出现几率在5%左右,而更弱结合力的NGA只有1.6%。
文章还探索了两个未发表的新型CRSIPR/Cas蛋白,VeCas9和BvCas12a。其中VeCas9的PAM序列用传统的E.coli双抗实验方法无法准确鉴定出。利用DocMF,这两个新型CRISPR/Cas蛋白的宽松PAM序列也均能被准确检出。同时研究人员还能根据芯片上信号变化比值,对不同PAM序列的活性排序,找出结合力最强的PAM序列,有助于设计体内基因编辑的最佳靶向位点。同时文章作者也讨论说明DocMF还可以被用来寻找Cas蛋白的脱靶序列。因此,DocMF为新型基因编辑系统的研究提供了一个强有力的工具,将会更快地推进更多新型编辑系统的发现及其功能研究。
为研究蛋白与DNA结合靶向位点的鉴定,团队选用无切割活性的dCas9进行测试,筛选出NGG序列为dCas9的PAM特异性位点,该特异性NGG序列是与以前的报道一致的。同时研究人员也发现,由于蛋白上两个氨基酸的突变,导致dCas9无法像传统的Cas9一样对NAG和NGA序列进行靶向结合。
DocMF平台基于华大智造测序仪,提供了一种检测多种蛋白质-DNA互作靶向位点的高通量的方法。整个鉴定流程耗时约三天,包括文库的制备、测序及分析,极大的缩减了工作时间及工作量。由于其高深度和高通量,也极大地提高了检测的准确性。
文章通讯作者之一、华大研究院院长徐讯表示,DocMF不只是全球唯一的能兼容鉴定蛋白与DNA结合或切割靶向位点的高通量平台,也具有鉴定CRISPR系统脱靶位点、转录因子结合位点的潜力。DocMF平台的开发,为后续蛋白质-DNA互作的研究提供了一个强有力的工具,同时此研究也扩展了以DNA纳米球为基础的测序技术的应用范围,体现了国产化基因测序平台研究工具的优势。
CNGBdb 的数据[存]储功能由旗下的国家基因库序列归档系统(CNSA,db.cngb.org/cnsa)负责,这是国内首个实现在线批量上传和审编的组学数据归档库,可支撑全球科研成果发表。截至2020年7月31日,CNSA已支持论文发表147篇,发表期刊92个,包括Cell、Nature、Science、Lancet等。
参考文献:
Li Z, Wang X, Xu D, et al. DNB-based on-chip motif finding: A high-throughput method to profile different types of protein-DNA interactions[J]. Science Advances, 2020, 6(31): eabb3350.
信息来源:“BGI华大”公众号
图片来源:参考文献,Science官网,CNGBdb官网。