2021-12-09 2478CNGBdb
科学数据库不仅可以全面展示相关科研成果,同时还可以作为重要的数据及分析资源,最大化科研成果的转化率,提升同领域科研工作者的科研效率。12月盘点季,小编就给大家推荐几个超级实用的植物科学数据库...
开发团队:该数据库由华中农业大学作物遗传改良国家重点实验室严建兵教授、杨宁教授团队,深圳华大基因股份有限公司,深圳国家基因库(CNGB)支持并持续开发新的多组学分析及可视化工具,旨在通过整合多组学数据助力玉米遗传改良。
数据资源:ZEAMAP收录了玉蜀黍属群体的多组学数据资源,包括基因组、转录组、遗传变异、表型组、代谢组和表观组等, 以及玉米多种复杂性状的遗传定位结果。
主要功能:ZEAMAP提供了丰富的在线数据检索, 分析和可视化工具,可以直观地对比较基因组、基因共线性区块、表达模式聚类、遗传变异基因型、连锁图谱、遗传定位结果、染色质交互、组蛋白修饰以及群体水平的DNA甲基化等多组学数据进行检索和分析,并提供相应的条目链接,实现在不同组学数据之间进行跳转访问。
开发团队:来自西北农林科技大学康振生院士团队和姜雨教授团队构建了WGVD,包括面包小麦及其祖先的全基因组重测序和外显子捕获数据的基因组变异,以及小麦驯化和改良期间的全基因组选择性信号,促进小麦的功能及育种研究。
数据资源:WGVD汇总了从968个面包小麦及其祖先中收集到的SNPs、indels,以及基于93个小麦全基因组重测数据的SNPs评估的小麦驯化和改良过程中的选择特征。在目前的版本中,WGVD包括7,346,814个SNP和1,044,400个indel,重点关注基因区以及上游/下游区域。
主要功能:WGVD可以通过用户友好的界面访问,提供四个主要功能:变异搜索、基因组选择信号搜索、基因组浏览器和比对工具(BLAST)。
开发团队:来自中国农业科学院蔬菜花卉研究所王晓武团队构建了十字花科植物基因组资源综合数据库(Brassica Database,BRAD),为比较基因组分析和研究整个十字花科物种的基因功能/进化提供了宝贵资源。
数据资源:BRAD是基于十字花科植物基因组数据搭建的数据,包括24个物种的35个基因组,基因组数据主要包括基因组组装、基因预测模型和基因注释。
主要功能:BRAD除了提供基因功能注释、基因序列、在线BLAST和基因组浏览器等传统的数据库服务之外,还提供了基因组区域微共线性、基因组序列截取、变异位点查询和引物设计等重要的特色服务,为下游研究提供数据支持。
开发团队:中国科学院武汉植物园水生植物生物地理学学科组陈进明、石涛团队联合武汉市园林科学研究院杨星宇团队构建了全球首个莲的基因组遗传变异与表达数据库:Nelumbo Genome Database,为莲的基因组进化、分子遗传以及分子育种等领域的研究及实验设计提供了宝贵的基因组资源。
数据资源:NGD包含了中国古代莲最新基于HI-C技术的染色体水平基因组组装序列,收录了注释到的150,589个mRNA转录本异构体和34,481个具有完整开放阅读框的基因;同时还整合了62个新测序的莲栽培品种和26个此前已报道的栽培品种的遗传变异和关键性状。
主要功能:NGD部署了BLAST、BLAT、Primer、Annotation Search、Variant和Trait Search等应用程序,用户可以通过NGD进行序列分析和基因搜索。
为了方便植物领域研究者查找和使用相关数据,国家基因库生命大数据平台(CNGBdb)开发了多个植物科学数据库,并整理多种植物资源数据集。
10,000种植物(tenKP或10KP)项目是地球生物基因组计划(EBP)的关键组成部分。10KP旨在对代表植物和真核微生物每个主要进化分支的10,000个以上的基因组进行测序。该项目将在五年内生成大规模植物基因组数据,解决有关植物进化的基本问题。
耐盐碱植物数据库, 旨在促进耐盐碱基因组学相关研究和实际应用。提供耐盐碱植物物种资源信息,植物耐盐碱相关基因组学数据和文献分类数据。其中,耐盐碱植物数据库(BiosalineDB)的子库:滩涂植物资源库,共收录了165种野生滩涂植物,并重点介绍了其形态、分布、特点、用途以及繁殖方式,同时每一物种都配有形态、生境、应用等方面的照片。用户可以通过资源库搜索框,使用中文名或拉丁名快速获取相关滩涂植物的全面信息。
万种药用植物数据库是基于广西创新驱动发展专项《药用植物大数据中心建设》(桂科AA18242040)项目数据设计,旨在建立全球最大的药用植物大数据中心,解读药用植物大数据与药效之间的关系,通过药用植物资源智慧创新、产品智慧创制,实现药用植物资源可持续利用,实现资源数据化、数据产业化、产业现代化,服务和推动中医药和大健康产业发展。
CNGBdb的数据资源→数据广场→植物板块也整理了多种植物基因数据集,包括水稻、小麦、玉米、大豆、拟南芥、棉花等。
上述科学数据库均可以通过国家基因库生命大数据平台(CNGBdb)官网快速访问 :https://db.cngb.org/.
参考文献
[1] Gui S, Yang L, Li J, et al. ZEAMAP, a comprehensive database adapted to the maize multi-omics era[J]. IScience, 2020, 23(6): 101241.
[2] Wang J, Fu W, Wang R, et al. WGVD: an integrated web-database for wheat genome variation and selective signatures[J]. Database, 2020.
[3] Wang X, Wu J, Liang J, et al. Brassica database (BRAD) version 2.0: integrating and mining Brassicaceae species genomic resources[J]. Database, 2015.
[4] Li H, Yang X, Zhang Y, et al. Nelumbo genome database, an integrative resource for gene expression and variants of Nelumbo nucifera[J]. Scientific data, 2021, 8(1): 1-7.
图片来源于CNGBdb官网和参考文献。