2020-12-10 3966其它数据库
2020年11月28日,澳大利亚默多克大学西澳洲大麦联盟主任李承道教授团队在《Database》发布首个大麦基因组变异公开数据库。该论文第一作者谈聪博士现在就职于深圳国家基因库(CNGB),主要负责生命大数据平台(CNGBdb)在线计算平台CODEPLOT的设计与开发,以及生命多组学数据分析挖掘等工作。
此前,李承道教授团队已发表大麦高质量基因组物理图谱 (Nature, 2017)和大麦泛基因组 (Nature, 2020) 研究最新成果。首个大麦基因组变异公开数据库的发布将为研究者提供大麦基因组变异信息和大麦参考基因组,以及超高密度的SNP和InDel标记,对大麦分子育种及重要农艺性状功能基因的鉴定具有重要意义。
BarleyVarDB数据库主要包括三个数据集:(1) 20个代表性栽培大麦或者野生大麦材料基于全基因组测序(∼40X)策略鉴定出的57 754 224个SNPs和3 600 663个InDels。(2) 向研究人员提供最新的大麦基因组参考和相应的基因注释信息。(3) 基于大麦参考基因组序列鉴定得到的522 212个微卫星序列,也称为简单序列重复(SSRs),可用于SSR分子标记开发。
此外,BarleyVarDB还提供了三个用户友好的在线工具:(1) 基因组可视化工具JBrowse用于显示基因组物理图谱及基因注释信息;(2) 序列比对工具 BLAST用于将用户感兴趣的序列与大麦基因组及其他大麦核心种质或者野生品种的de novel 组装序列进行比对分析;(3) 引物设计工具primer3用于针对大麦基因组一站式进行引物设计, 用于基因扩增或者标记开发。
大麦是最早驯化的粮食作物之一,由于大麦可以在温暖干燥的中东地区和寒冷干燥的西藏等多样化的极端环境中生长,因此被广泛用作研究植物适应性进化过程的遗传基础的模式生物,也是探索植物非生物和生物胁迫耐受性的重要基因资源。大麦参考基因组的发布,以及新一代测序技术的巨大优势,使探索大麦种质基因组变异更加高效,从而加速大麦基因组和遗传研究的进展。
目前已有多个基因组变异数据库,如在水稻中开展的RiceVarMap ,SNP-Seek和HapRice,以及NCBI的dbSNP等。但直到最近,除了GrainGenes等几个分子标记数据库和Barlex的大麦物理图谱信息外,还没有任何公开的大麦基因组变异信息数据库。现阶段,大麦基因组研究急需建立一个全面的大麦基因组变异数据库,以共享和利用不同研究项目开发的基因组变异信息。因此,李承道教授团队构建了一个专门研究大麦基因组变异的综合数据库:BarleyVarDB。
用户可通过搜索功能模块实现:通过ID搜索或在目标区域搜索SNP/InDel/SSR/基因注释、在基因内搜索SNP/InDel、在两个样本之间搜索多态性SNP/InDel、根据基因列表搜索基因功能等。
基于JavaScript的基因组浏览器(JBrowse)是一个用户友好的交互式web界面,用于显示和操作整个基因组范围的数据集。用户可通过JBrowse快速检索和查看参考基因组序列、参考注释信息、基因组变异、基因表达水平等信息。
BarleyVarDB中建立了最新版本大麦基因组参考的BLAST服务器。构建的BLAST数据库包括大麦全基因组序列、编码序列、转录序列和预测蛋白序列;BarleyVarDB部署了以primer3plus为核心程序的基于web的PCR引物设计系统;除了正常的引物设计功能外,还增加了针对大麦基因组的自动化检测标记设计功能,用户可以针对查询到任意两个大麦品种之间有差异的INDEL,一键获取变异位点周围模板序列,一站式设计检测标记的引物序列,用于大麦分子辅助育种或功能基因定位。
用户可在“Download”页面下载BarleyVarDB数据库中的数据信息。
BarleyVarDB访问地址:http://146.118.64.11/BarleyVar
参考文献
1.Cong Tan, Brett Chapman, Penghao Wang, Qisen Zhang, Gaofeng Zhou, Xiao-qi Zhang, Roberto A Barrero, Matthew I Bellgard, Chengdao Li, BarleyVarDB: a database of barley genomic variation, Database, Volume 2020, 2020, baaa091,https://doi.org/10.1093/database/baaa091
2.BarleyVarDB:http://146.118.64.11/BarleyVar/
图片来源于BarleyVarDB,如有侵权请联系删除。