2021-06-18 2600CNGBdb
面包小麦(Triticum aestivum)是世界上最重要的农作物之一。随着完整的小麦参考基因组的发布以及下一代测序技术的发展,来自面包小麦及其祖先的大量基因组数据已经产生,并为小麦遗传学研究提供了基因组资源。
为了方便有效地访问和使用这些数据,来自西北农林科技大学康振生院士团队和姜雨教授团队构建了小麦基因组变异与选择信号数据库(WGVD),包括面包小麦及其祖先的全基因组重测序和外显子捕获数据的基因组变异,以及小麦驯化和改良期间的全基因组选择性信号,促进小麦的功能及育种研究。文章“WGVD: an integrated web-database for wheat genome variation and selective signatures”发表在Database(Oxford)期刊。
WGVD是一个基于web的开源数据库,汇总了从968个面包小麦及其祖先中收集到的SNPs、indels,以及基于93个小麦全基因组重测数据的SNPs评估的小麦驯化和改良过程中的选择特征。在目前的版本中,WGVD包括7,346,814个SNP和1,044,400个indel,重点关注基因区以及上游/下游区域。
WGVD可以通过用户友好的界面访问,提供四个主要功能:变异搜索、基因组选择信号搜索、基因组浏览器和比对工具(BLAST)。
WGVD提供了两个版本的面包小麦基因组(IWGSC RefSeq v1.0和IWGSC RefSeq v2.0)供用户选择,用户可通过参考基因组中给定的基因名称或基因组位置获得详细的SNPs或indels信息,拿到每个变异在不同分组的频率分布。此外,用户还可以设置参数、MAF和变异类型,以更有效的方式搜索感兴趣的变异。检索结果以交互式表格和图形显示。
用户可以通过选择基因名称或基因组位置、统计方法、小麦品种以获得选择信号的信息。搜索结果分别在染色体和全基因组水平上对目标基因或区域进行详细注释和相应的选择性标记。
Gbrowse:参考基因组IWGSC RefSeq v1.0和IWGSC RefSeq v2.0共提供了19条和6条轨道。用户通过检索基因名或染色体位置,可整体查看SNP、indel和选择信号。
Blast:用户可输入fasta格式的序列来搜索参考基因组IWGSC Ref Seq v1.0和IWGSC RefSeq v2.0中的同源区域。
在“Sample Table”页面,用户可以查看968个小麦样品的信息。
在“Download”页面,用户可以下载WGVD中的变异和选择信号数据。
WGVD访问地址:https://db.cngb.org/WGVD/.
WGVD开发团队介绍
康振生院士团队长期从事有关小麦条锈病的研究,在小麦条锈病的发生规律、致病机理与防治技术研究等方面取得了重要突破。在Nature Communications, Molecular Plant, Annual Review of Phytopathology, New Phytologist等SCI期刊上发表论文280余篇。
姜雨教授团队长期从事家养动物基因组大数据分析研究,致力于农业动物的群体遗传研究、关键性状的遗传解析和优良新品种培育,已在Science、Molecular Biology and Evolution、Nature Communications等国际著名期刊发表了一批有影响力的学术成果。目前主持国家青年人才计划、国家优秀青年科学基金、国家自然科学基金和学校双一流学科群PI团队等科研项目。
参考文献
Wang J, Fu W, Wang R, et al. WGVD: an integrated web-database for wheat genome variation and selective signatures[J]. Database, 2020.
图片来源于WGVD和参考文献,如有侵权请联系删除。