2021-11-27 1423CNGBdb
11月26日,深圳华大生命科学研究院主导在Nature Communications期刊发表题为“Chloranthus genome provides insights into the early diversification of angiosperms” 的研究论文。该研究从金粟兰目基因组水平,确定金粟兰目一直存在争议的系统发育位置,为核心被子植物五大类群系统发育关系进一步研究奠定基础,揭示金粟兰目植物药用和芳香化合物利用价值,为物种资源保护提供科学支撑。
此项研究中产生的基因组和转录组测序数据已存储于国家基因库生命大数据平台(CNGBdb),项目编号为:CNP0001771 。
被子植物是地球数量最多,种类最丰富的植物类群,超过35万种。植物间清晰的亲缘关系系统发育树,对于了解被子植物的起源、物种扩张至关重要。
尽管被子植物系统发育研究经历了20多年的发展,核心被子植物5个分支之间的深层关系仍然难以确定,其中金粟兰目的系统位置是最核心的问题之一,这个分支也是核心被子植物最后一个缺乏基因组解析的类群。鉴于金粟兰目植物关键的进化位置,解析金粟兰目植物基因组及其系统位置的确定颇为重要。
金粟兰目有1科4属约77种,小型灌木或多年生草本,分布于热带亚热带地区。金粟兰属共约17种,有13个种分布于中国。
金粟兰(Chloranthus spicatus),分布在日本以及中国大陆的广东、贵州、福建、四川、云南等地,生长于海拔200-1000米的森林中,产芳香化合物可用于提炼精油,具有良好的药用和经济价值。
深圳华大生命科学研究院数字化地球研究所所长刘欢研究组联合美国佛罗里达大学Douglas E.Soltis研究团队构建了金粟兰染色体级别的高质量精细基因组图谱。研究发现该物种基因组中包含一定数目的超长基因(基因长度超过20K),这些超长基因的出现是由于大量LTR插入导致基因内含子区域变长(图二)。
基因组进化分析发现金粟兰和同类群蛔形兰属Ascarina,草珊瑚属Sarcandra植物在约98–130 百万年前共享一次古老的全基因组加倍事件kappa (κ) (图三)。同时还发现金粟兰与无油樟、葡萄在基因组区域的共线性关系具有较高的保守性。
基于多物种核基因组和叶绿体基因组数据,获得四个核基因矩阵和两个叶绿体基因矩阵所有数据集构建的系统发育树结构都支持金粟兰是木兰类的姐妹群。使用DensiTree 对18个物种的核基因树和叶绿体树进行可视化,发现二者存在拓扑分支冲突:核基因树溯祖法和串联法建树支持金粟兰-木兰类姐妹群和双子叶-金鱼藻分支关系较近,单子叶植物位于核心被植物最基部分支;而叶绿体基因建树结果支持单子叶植物与双子叶-金鱼藻分支构成姐妹关系,而金粟兰-木兰类位于核心被子植物最基部分支。这种分支关系不一致也大量体现在核基因单独建树的结果中(图四左)。
随后研究者使用QuIBL, PhyloNet 和ABBA-BABA D-statistics三种方法分析金粟兰-木兰类系统位置的矛盾,结果表明,在早期被子植物进化过程中单双子叶植物之间可能发生基因流,造成主要分支之间基因树、或核基因组-叶绿体基因组系统发育分支关系不一致(图四右)。
该研究进一步挖掘了金粟兰次生代谢产物萜烯类合成相关的遗传基础。基因家族分析表明金粟兰-木兰类分支植物比被子植物其他类群具有更多的萜类合成基因,具体体现在TPS-a 和TPS-b家族发生明显扩张,主要包含被子植物特有的单萜和倍半萜合成酶相关基因。
同时,通过转录组分析发现甲羟戊酸(MVA)和5-磷酸甲羟戊酸(MVP)途径中多个酶编码基因都有较高的表达量,这与金粟兰产芳香物质能用于提炼精油的特性相吻合。
研究者还发现金粟兰-木兰类植物基因组中NBS-LRR基因家族发生显著收缩,TNL和RNL类基因完全缺失。这些比较基因组学分析为探讨TPS 和NBS-LRR基因家族在被子植物系统发育大框架下各大类群的进化模式提供了参考。
深圳华大生命科学院研究院数字化地球研究所郭兴博士、方东明高级工程师,Sunil Kumar Sahu博士为论文共同第一作者,深圳华大生命科学研究院数字化地球研究所所长刘欢、美国佛罗里达大学Douglas E. Soltis院士为共同通讯作者。本项目是基于万种植物基因组计划10KP开展的系列工作。本项目获得国家重点研发计划“中医药现代化研究”重点专项支持。
参考文献
Guo, X., Fang, D., Sahu, S.K. et al. Chloranthus genome provides insights into the early diversification of angiosperms. Nat Commun 12, 6930 (2021).
信息及图片来源:“华大BGI”公众号