2022-01-17 3221文献解读
引物设计是PCR成功与否的关键因素之一。目前已经发表了上百种引物设计的软件,该如何选择这些PCR引物设计软件呢?此前《Bioinformatics》发表了一篇题为“Classification and review of free PCR primer design software”的综述文章,对目前可用的免费PCR引物设计软件进行分类和回顾性总结。
考虑到本文总结的软件有一半以上是基于Primer3,所以把Primer3本身归为一个类别。这个开源软件在20世纪90年代末的发布可以被认为是一个里程碑式的事件。Primer3的独特之处在于它为PCR引物设计提供了第一个免费、可靠和通用的工具。为了满足不同应用的需要,Primer3的设计提供了许多选项来控制引物的位置、大小、GC含量、Tm和产物大小。其经历过两次重大修订,结合其他生物信息学工具,Primer3可用于本文讨论的所有PCR应用。
PCR的一个应用是产生Sanger测序所需的大量DNA模板。为了克服Sanger测序技术带来的有限读长,这一类的所有软件都设计了引物对,以产生一个扩增子组覆盖指定的目标区域。PrimerZ可根据基因名称或Ensembl登录号,为基因的外显子和启动子设计重叠引物;JCVI primer designer允许研究者指定任意的基因组区域;ExonPrimer(未发表)需要cDNA和相应的基因组序列作为输入,将这些序列对齐并设计PCR引物来扩增每个外显子;MPDP3(未发表)将序列作为输入,并设计具有自定义长度的引物对;ConservedPrimers 2.0通过将EST与进化相关的参考基因组对齐来设计内含子克隆引物;PrimerDesign-M针对高度可变的基因组(如HIV序列),基于多重序列比对,在保守区设计测序引物。
RT-qPCR的主要功能是测量基因表达水平。为了实现这一目标,最好是扩增从mRNA产生的cDNA,而不是从被污染的基因组DNA模板上扩增。引物对的选择应使其中一个引物与基因组水平上不存在的外显子-外显子边界序列相匹配。或者,在设计引物对时,应将每个引物放在不同的外显子中,这样基于基因组序列的产物将包括一个长的内含子序列。Autoprime,Quantprime和Primer-BLAST是为自动设计扩增cDNA但不扩增基因组DNA模板的PCR引物而定制的。此外,Primer-BLAST避免了引物中的单核苷酸多态性。
SNP可以通过引物引入限制性分析(PIRA)PCR或四引物扩增受阻突变系统(ARMS)PCR检测。PIRA PCR designer(即PCR designer)搜索所有可能产生人工限制位点的错配,并使用它们设计引物。除了SNP检测,PCR designer还可以检测缺失和插入;PRIMER1是专为ARMS PCR开发的,它允许用户输入目标DNA序列,指定多态性位点并定义引物和产物大小的标准。
高等真核生物中的大多数多外显子基因是选择性剪接的,这在基因功能和病理过程中具有重要意义。为了研究这一现象,PCR被应用于外显子剪接事件的检测和定量。RASE定义了特定扩增剪接异构体的引物设计规则,并将其整合到RASE自动流程中;PRIMEGENS-V2还通过设计引物对提供帮助,这些引物对可以在存在同源和剪接变异的情况下,独特地放大单个目标基因。 此外,该软件设计了多重引物对,可以放大所有剪接和复制基因模型的变异;PrimerSeq通过在设计过程中加入用户提供的转录组配置文件,使其与上述软件程序不同。PrimerSeq利用用户提供的RNA-seq数据来定义剪接模式,以选择放置RT-PCR引物所需的合适区域。
胞嘧啶甲基化是调节基因组功能的重要机制。检测甲基化模式已成为了解基因表达调控和诊断甲基化相关疾病的重要手段。植物在CG、CHG和CHH位点存在胞嘧啶甲基化,而CG甲基化是哺乳动物中唯一存在的形式。基于亚硫酸氢盐转化的PCR方法是甲基化检测的常用技术,如BS-PCR、MS-PCR、COBRA和MSRE-PCR等。MethPrimer预测CG岛并设计用于BS-PCR和MS-PCR的引物;BiSearch设计了BS-PCR引物,同时避免了亚硫酸氢盐处理基因组的错误引物;Bisprimer主要是为在植物中进行BS-PCR的研究人员设计的,但它也可用于哺乳动物样品或其他只有CG甲基化的样品;与其他工具不同,MSP-HTPrimer在设计甲基化检测引物对时考虑了全基因组的SNP和重复注释。MSP-HTPrimer能为BS-PCR、MS-PCR、COBRA和MSRE-PCR分析设计引物。
微卫星是常用的分子标记,因为它们的高度多态性可以作为唯一的识别符。MSATCOMMANDER使用正则表达式模式匹配来定位微卫星并设计引物,它允许在其5'端进行引物标记;WebSat允许序列提交、微卫星可视化并设计引物进行扩增;QDD被设计用来处理所有的设计步骤,从大量的原始序列开始到定位和设计用于微卫星扩增的PCR引物。
在理想情况下,设计PCR引物以扩增所有包含微小变异的模板只需识别保守/相同区域并从这些保守区域中选择非简并引物。然而,当模板变异程度增加时,保守区域可能变得过于碎片化,无法设计非简并引物。在这种情况下,必须使用简并引物。GeneFisher2和PriFi目的是利用不同生物的同源基因进行多重比对,分离目标生物中的基因。与此相反,HYDEN是为了破译基因家族而开发的;Amplicon具有图形交互界面,允许用户从多个序列校准文件中查看、编辑和选择序列;Primaclade和PrimerIdent获取一个alignment文件,以查找alignment中每个序列的所有引物集;相比之下Gemi和easyPAC取一个alignment文件来构建一个一致序列,然后从这个序列中搜索引物和探针。此外,easyPAC还可以选择将设计的简并引物映射到任意数量的参考文件或可能包含同源基因的整个基因组;最后要提到的一个软件程序是TOPSI,它设计了一种细菌的多个菌株专门共享的实时PCR引物,用于病原体检测。
多重PCR是一种有效的方法,通过同时扩增节省时间和DNA样本。然而,在为多重PCR设计引物时,还需要考虑其他标准,这包括避免引物二聚化和所有引物之间匹配的引物熔解温度。MuPlex是基于引物延伸技术为SNP基因分型而开发的;MultiPLX计算现有PCR引物的相容性评分,并对多重PCR引物进行分组;Oli2go将多个序列作为输入,为所有序列设计多重引物和探针,其特异性检查不仅限于单个物种,而且可以在多种物种上进行;MPprimer和PrimerStation设计多重引物组,其扩增子的大小不同,以便通过电泳分离;MCMC-ODPR采用Markov chain Monte Carlo优化方法,围绕单核苷酸多态性设计多重简并引物,注重引物的可重复使用性,以降低成本。
在研究与性状或疾病相关的有限基因组区域时,Targeted NGS是首选技术。有两个专门为TargetedNGS开发的多重PCR软件程序。MPD接受文件中的基因组坐标列表,并自动设计多重PCR引物,同时避免将引物放在已知变异的位点上;Optimus Primer接受基因组坐标列表或基因列表。它自动设计引物来扩增不同的基因亚型和外显子。它还分割大的外显子以保持所需的扩增子大小。MPD和Optimus Primer都将引物汇集成兼容组,以促进多重PCR。
PerlPrimer:在输入序列中找到开放阅读框(ORF),围绕ORF设计引物,并允许用户在每个引物上附加额外的5'序列以用于克隆目的;(ii) 发现CG岛并设计MS-PCR引物;(iii) 找到内含子/外显子边界并设计RT-qPCR引物;(iv) 设计用于Sanger测序的引物。
The PCR Suite:设计Sanger测序引物,并设计包含(i) SNP;(ii) 单个基因的所有外显子;(iii) cDNA列表中的所有ORF的引物。
BatchPrimer3:(i) 发现微卫星并设计微卫星侧翼引物;(ii) 设计用于SNP基因分型的单碱基延伸、等位基因特异性和tetra-primer ARMS PCR引物。
jPCR:设计(i) 多重PCR引物;(ii) 保守区/简并引物;(iii) 合成包含目标序列的连续片段的引物(重叠延伸PCR);(iv) 围绕微卫星的引物。
Primo:设计(i) 基于单个蛋白质或多个蛋白质或核苷酸的保守区/简并引物;(ii) 多个引物对,每个引物特异性地扩增一个家族中的一个基因;(iii) 几个简并引物,用于扩增一组数百或数千个基因中的大多数基因。目的是让用户只用几个PCR反应就能对选定的一组基因进行基因表达分析;(iv) 用于克隆基因以进行表达研究的引物;(v) 多重PCR引物;(vi) 用于定点突变的引物;(vii) MS-PCR和BS-PCR引物。
除了用于普通PCR应用的软件外,还有一些为特定应用而设计的程序。RJPrimers发现转座因子连接点(基因组中的独特位点)并设计独特的引物;PrimerX(未发表)设计用于定点突变的引物;AcePrimer专门为秀丽隐杆线虫设计引物;PrecisePrimer设计用于分子克隆的引物,包括基于限制性内切酶、GoldenGate、Gibson和非连接性克隆;MultiMPrimer3从微生物中发现物种特异性重复序列,并自动为这些重复序列设计物种特异性PCR引物,以提高病原体诊断的敏感性;AmplifX(未发表)除了基本的引物设计功能外,还用一个数据库管理引物。
参考文献
Guo J, Starr D, Guo H. Classification and review of free PCR primer design software[J]. Bioinformatics, 2020, 36(22-23): 5263-5268.
图片均来源于参考文献,如有侵权请联系删除。