2024-10-30 197文献解读
DNA条形码利用一个或多个标准化的短DNA区域进行分类识别。随着新一代测序技术(如NGS、ONT MinION nanopore和PacBio)的出现,DNA 条形码变得更加准确、快速和可靠。DNA 条形码快速物种识别已用于法医学、食品供应链控制和疾病理解等多个领域。
生命条形码联盟 (CBOL) 提出了各种工作组来识别通用条形码基因。生命数据条形码系统(BOLD SYSTEM)的引物数据库可用于搜索已发表的引物信息。
研究人员还可以使用Primer3、QPRIMER、UniPrime、Prima-clade、Amplicon program, Primer Hunter, Greene SCPrimer 和ecoPrimer etc等软件来设计特定引物。
COI基因是高度保守的线粒体基因,编码将分子氧还原成水的呼吸电子传递链蛋白,存在于所有需氧生物体内。线粒体基因比核基因更受青睐,因为线粒体基因通常是单倍体,缺乏内含子,重组有限。线粒体以二分裂方式繁殖,不存在有性重组,因此线粒体基因较少受到插入、缺失或其他大规模重排的影响,这些重排会在序列中引入更模糊的变异。线粒体基因组的进化速度高于核基因组。因此,线粒体基因组序列在区分或区分近亲物种方面更具参考价值。到目前为止,COI基因已被用作蛾、蝴蝶、跳虫、甲虫、蝙蝠、蜘蛛、黄蜂、蚂蚁、鱼、爬行动物、鸟类、鸡、麝、果蝇和甲壳类幼虫的条形码基因。
一些灵长类分类学家建议在灵长类物种划分中使用ND5(编码NADH的线粒体基因:泛醌氧化还原酶核心亚基5)和COII作为条形码,并认为这两个基因比COI更适合作为标记,因为它们的条形码差距更明显。
在植物物种识别方面,条形码基因的选择仍然存在很大争议。植物线粒体基因组的突变率(核苷酸替换)很低,这限制了COI作为通用植物条形码的应用。植物分类学家花费了大量时间,找到了叶绿体基因组作为线粒体基因组的替代基因。2009 年,CBOL植物工作组提出了七种潜在的条形码,如 rbcL, matK, psbA-trnH,rpoC1,rpoB, atpF-atpH和psbK-psbI。核基因ITS和所有叶绿体条形码都已在植物物种中得到证实。比较而言,与rbcL结合的matK的600-800碱基对区域结果最令人满意,并被指定为核心条形码基因,而 psbA-trnH 则可作为其他植物物种的良好标记,并被确定为重要的补充标记,但目前还没有一种标记可用于识别所有植物物种。
CBOL已启动原生生物工作组 (ProWG),以确定所有原生生物谱系的条形码区域并建立参考DNA条形码库。CBOL ProWG为原生生物引入了两步流程:第一,用于初步鉴定的通用预条形码;第二,应用群体特定条形码进行种水平识别。18S rRNA基因的高变V4区被提议作为通用的真核生物预条形码,而类群特定条形码则为每个重要的原生生物谱系单独定义。到目前为止,ITS、COI、rbcL、18S rRNA基因、28S rRNA基因区域已被提议作为原生生物DNA条形码。ITS是真菌的通用条形码,对纤毛虫、甲藻类和卵菌也有很强的区分能力。线粒体 COI 是动物的通用条形码,也是其他生物的默认条形码,在原生生物中也得到了积极的验证。18S 核糖体RNA基因的高变区V4和V9是了解硅藻、甲藻和纤毛虫多样性和系统发育关系的有前途的条形码。rRNA基因大亚基 5′ 端的D1-D2和/或D2-D3区域可作为许多原生生物谱系(如硅藻、纤毛虫和甲藻)的潜在条形码。一些群体特异性条形码(如 rbcL 和剪接前导RNA基因)也分别用于光合原生生物和锥虫。
目前正在开发用于动物、植物和真菌的大型 DNA 条形码公共参考库,但还没有用于纤毛虫物种鉴定的通用条形码。用于纤毛虫识别的条形码有:(1)线粒体细胞色素c氧化酶亚基I基因(COI基因);(2) 小亚基(SSU)rRNA的高变区,如V4和V9区等;(3) ITS区;(4) rRNA基因大亚基(LSU)的D1-D2区和(5)组蛋白H4。
上述表格中小写字母表示添加到基因组序列中以促进PCR的核苷酸;D=A/G/T,Y=C/T,R=A/G,W=A/T,M=A/C,B=C/G/T,V=A/C/G,H=A/C/T,K=G/T,N=A/G/C/T;
建议对技术细节感兴趣的小伙伴请参考文献原文~对于文献整理过程中有翻译不当或错误也欢迎大家在评论区留言指出,互相交流学习!
参考文献Antil S, Abraham J S, Sripoorna S, et al. DNA barcoding, an effective tool for species identification: a review[J]. Molecular biology reports, 2023, 50(1): 761-775.