国际项目数据资源 | 万种鱼基因组项目(Fish10K)及其公开数据

2020-09-08 2839其它数据库

2020年8月,来自中国、美国、沙特阿拉伯、澳大利亚、加拿大等多机构的研究团队在《GigaScience》杂志发文宣布了万种鱼基因组项目(Fish10K)并发布了先导研究中的10个代表性鱼类高质量基因组数据。

Fish10K已发布的10个鱼类基因组组装数据已保存在国家基因库生命大数据平台(CNGBdb),项目编号:CNP0000597和CNP0000691,同时还可通过CNGBdb访问Fish10K网站

3-1.png

鱼类基因组公开数据不到1%

鱼类是最大的脊椎动物群,有30,000多种。截至Fish10K联盟撰文时,鱼类的基因组的公开数据不到1%(截至2020年4月21日NCBI查询结果为244种),这些基因组数据推动了许多有关鱼类(如非洲腔棘鱼)的系统发育和进化,特定鱼类亚群的进化过程(例如大象鲨基因组说明了软骨鱼类作为骨质脊椎动物的姊妹群的系统发育关系),适应不同环境的遗传机制以及特定的生物学过程的研究。尽管如此,当前鱼类基因组测序的结果只是沧海一粟,许多关键的研究问题仍有待解决。

鱼类基因组学在许多生态系统和人类社会中起着至关重要的作用,但仍落后于鸟类和哺乳动物的研究。这严重限制了对进化的理解,并阻碍了对鱼类保护和可持续利用的进展。

3-2.png

万种鱼基因组项目(Fish10K)

研究团队在此文中宣布了Fish10K项目,作为Earth BioGenome Project的子项目,Fish10K旨在对10000种鱼的基因组进行采样,测序,组装和分析。

Fish10K计划历时10年,分三个阶段,采集10000种代表性的鱼类。通过进行高深度测序构建其基因组精细图谱,为鱼类的物种多样性保护和经济鱼类的育种提供分子基础,为水产养殖和海洋生态保护提供重要的基因依据。

3-3.png

测序和组装策略:2017年6月研究团队启动了先导研究,从93个样本中选择了10种样本来验证测序和组装策略。已组装的10个基因组contig和scaffold N50平均长度分别为2.83Mb和7.59Mb,BUSCO完整性估计为96%。

3-4.png

阶段I:对450种硬骨鱼和50种软骨鱼进行测序,覆盖所有80个目。
阶段II:对大约3000种鱼类进行测序,覆盖几乎所有~500个科。
阶段III:对~6500种鱼基因组进行测序,覆盖~5000个属。

3-5.png

鱼类进化树。下颌脊椎动物(gnathostomes)分为两大类:软骨鱼类(Chondrichthyes;橙色)和骨质脊椎动物(Osteichthyes;蓝色和绿色)。硬骨鱼分为两个亚组(Sarcopterygii;绿色)和(Actinopterygii;蓝色)。对5个最大目的科、种数进行了分类。

Fish10K项目数据共享

Fish10K项目所有测序数据(包括原始数据,组装数据和注释)将存放在NCBI、GigaDB和国家基因库。 

Fish10K网站将提供项目状态的详细信息以及有关已测序物种的持续更新信息。http://icg-ocean.genomics.cn/index.php/fish10kintroduction

除了Fish10K,CNGBdb还为这些国际项目提供了数据共享服务

3-6.png

可通过CNGBdb官网 → 科学数据库板块,访问关于这些项目的专属网站。

参考文献:
Fan G, Song Y, Yang L, et al. Initial data release and announcement of the 10,000 Fish Genomes Project (Fish10K)[J]. GigaScience, 2020, 9(8): giaa080.  
图片来源:参考文献,CNGBdb官网。部分信息来源于“青岛华大”公众号。

上一篇下一篇

相关专题