2021-12-28 1548CNGBdb
2021年12月21日,郑州大学、中国农科院棉花所何守朴团队在国际著名期Frontiers in Plant Science发表了题为“CottonGVD: A Comprehensive Genomic Variation Database for Cultivated Cottons”的研究论文。构建了棉花基因组变异数据库(CottonGVD,http://db.cngb.org/cottonGVD)。
棉花是最重要的经济作物,为纺织工业生产天然纤维。近年来,通过对栽培棉花几个基本性状基因组变异的解码,逐渐阐明了其遗传基础。虽然有大量的重测序数据公开,但仍然缺乏一个全面的工具来展示基因组变异和全基因组关联研究(GWAS)的结果。
为了帮助棉花研究人员高效、方便地利用这些数据,作者构建了棉花基因组变异数据库(CottonGVD;http://120.78.174.209/或http://db.cngb.org/cottonGVD)。该数据库包含3个不同棉花品种的5个自然群体的重测序数据(SNP和InDel)和大量的环境表型数据,以及主要性状的GWAS可视化结果。各种内置的基因组工具帮助用户检索,浏览和查询。数据库还提供了交互式图谱(如曼哈顿图、散点图、热图、连锁不平衡区)展示GWAS结果。该网站可使棉花研究人员很容易地专注于表型相关位点的可视化,方便对筛选候选基因。此外,CottonGVD还将继续更新,增加更多的数据和功能。
同时,文中还提供了一个示例来演示GWAS可视化工具的使用。通过选择陆地棉ad1.1245群体和纤维长度性状的多个环境表型数据,可以直接获得GWAS结果。最后,识别并保存具有显著遗传差异位点的曼哈顿图和散点图。一方面,可以获得该区间的基因列表以及棉ad1.383群体和TM-1的转录组数据。另一方面,基于eGWAS结果,可以选择单个基因获取注释信息,进一步探索重要的基因表达调控机制。
总之,CottonGVD显示的高密度变异数据为检测基因组变异、基因注释、SNP和GWAS结果的可视化提供了丰富的信息。用户可以通过整合转录组和eGWAS结果,在GWAS信号的基因组区域定位致病基因,从而进一步指导靶向基因编辑。该数据库将利用基于新工具模块的分子设计方法,整合高密度基因组变异在分子标记开发和产量和品质遗传改良中的选择,促进分子育种。
参考文献
He S, Peng Z, Li H, et al. CottonGVD: a comprehensive genomic variation database for cultivated cottons[J]. Frontiers in Plant Science, 2896.