CNGBdb
国家基因库农业数字化服务平台
首页
农业服务
核心技术
合作案例
/
合作案例

3000水稻数据挖掘

近两年来,国家基因库完成的农作物重测序及项目合作包括3000水稻项目、千种植物项目、万种植物基因组项目、瑞丽植物园数字化项目等,国家基因库全面开放项目数据资源,研究人员可利用大数据进行的分析挖掘和利用,助力育种工作。

联合多家机构展开水稻育种工作,囊括3000多份水稻,代表全球95%水稻遗传多样性。项目研究论文发表在《Nature》。

由中国农业科学院作物科学研究所牵头,联合IRRI、上海交大、华大基因、深圳农业基因组研究所、安徽农大等16家单位共同完成了“3000份亚洲栽培稻基因组研究” ,并于2018年4月发表在《Nature》上。研究针对水稻起源、分类和驯化规律进行了深入探讨,揭示了亚洲栽培稻的起源和群体基因组变异结构,剖析了水稻核心种质资源的基因组遗传多样性。

3000份水稻(来自全球89个国家和地区)代表了全球78万份水稻种质约95%多样性的核心种质。通过全基因重测序,每个样本平均测序深度14X,利用重测序数据共检测到32M的高质量SNPs和InDels。对亚洲栽培稻群体的结构和分化进行了更为细致和准确的描述和划分,由传统的5个群体增加到9个。研究着重分析了453个测序深度>20X品系的SVs,利用SVs构建的进化树与SNP构建的进化树类似。大量的SVs可能是不同程度杂种不育和XI与GJ杂种衰退的遗传基础。同时构建了亚洲栽培稻的泛基因组,包括12,770个(62.1%)核心(core)基因家族和9,050个(37.9%)分散式(distributed)基因家族。发现了1.2万个全长新基因和数千个不完整的新基因。核心基因比较古老,大多数的新基因表现更年轻和长度偏短。

[1]: Wang, W., Mauleon, R., Hu, Z. et al. Genomic variation in 3,010 diverse accessions of Asian cultivated rice. Nature 557, 43–49 (2018). https://doi.org/10.1038/s41586-018-0063-9