Cell发布来自不同人群的结构变异图谱,发现超过12万个变异 | 数据资源推荐

2020-06-16 279其它数据库

英国威康桑格学院研究所的研究人员通过对人类基因组多样性计划(HGDP)中数据集的结构变异进行全面分析,生成了来自不同人群的结构变异图谱,为人类参考基因组(人类所有遗传学的世界标准)增加了新的序列区域,为全球精准医学研究提供宝贵的数据资源。此项研究成果已发表在最新一期的《Cell》杂志。

1-1.png

研究团队分析了HGDP中来自全球54个不同人群的911个样本,总共发现了126018个变异,其中78%在以前的全球测序项目中没有发现;通过使用linked-read测序从头组装25个基因组,发现了1643个独特插入,总计占GRCh38参考基因组中1.9 Mb的缺失序列。

为什么要研究不同人群的结构变异?

结构变异(包括缺失、重复、倒位和插入)在核苷酸水平对基因功能的影响高于任何其他种类的变异,在基因组进化和疾病易感性中起重要作用。虽然全基因组测序项目对物种的进化史提供了前所未有的洞察,然而大多数大规模的遗传研究通常都集中在影响单个DNA单碱基对的变化上。并且,以往调查全球人群结构变异的研究,都是在低覆盖率下或从大量人群中抽取一些样本来研究,允许进行广泛的大陆比较,但限制了对每个大陆群体和人群的详细分析。

为了更全面的研究来自不同人群的结构变异,英国威康桑格学院研究所的研究人员对HGDP中数据集的结构变异进行了全面分析。

来自不同人群的结构变异图谱

1-2.png

研究团队以36×的平均深度生成了911个全基因组序列,通过分析共发现126018个结构变异,与已发布的结构变异目录进行比较,其中78%在以前的全球测序项目中没有发现。

1-3.png

1-4.png

分析得到的结构变异有些传播频率很高,并且对大陆群体甚至个别人群都是专有的,包括区域限制的失控重复和潜在的古人类渗入变种。其中医学上的重要变异是从巴布亚新几内亚及附近大洋洲种群的Denisovan祖先那里继承而来的,包括AQR基因的高频缺失,该变异在检测病毒和调节抗病毒免疫反应中起作用。

1-5.png

通过使用linked-read测序从头组装25个基因组,研究团队发现了1643个独特插入,总计占GRCh38参考基因组中1.9 Mb的缺失序列。这些结果说明了单一人类参考基因组的局限性,并且需要来自不同人群的高质量基因组来充分发现和理解人类遗传变异。

研究数据

本研究中生成的数据集可访问如下网址获取:ftp://ngs.sanger.ac.uk/scratch/project/team19/HGDP_SV/

原始序列和10×Genomics平台linked-read数据已保存至ENA,数据编号分别为PRJEB6463和PRJEB14173。

参考文献
Almarri MA, Bergström A, Prado-Martinez J, et al. Population Structure, Stratification, and Introgression of Human Structural Variation [published online ahead of print, 2020 Jun 10]. Cell. 2020;S0092-8674(20)30619-X. 
引用
Wellcome Trust Sanger Institute. "Denisovan DNA influences immune system of modern day Oceanian populations." ScienceDaily. ScienceDaily, 11 June 2020. .
图片来源:均来自参考文献,如有侵权请联系删除。

上一篇下一篇

相关专题