国家基因库系列数据库再添新成员
深圳国家基因库将采用新的系统架构应用于PB级的生物大数据共享平台,从数据层的数据仓库、数据集市、数据库集群、索引集群和计算集群,到应用层上的搜索引擎、 分析可视化、授权管理、递交和下载等数据服务,通过 API 以不同的管理颗粒度开放数据平台中各层级的存储、计算、网络、搜索、分析等能力。目前深圳国家基因库已经构建 了核酸系列归档系统(CNSA)归档原始数据,包括项目,样本,实验和测序原始数据,组装数据提交,并提供数据下载,管理和检索服务
免疫数据库版本升级
Pan Immune Repertoire Database (PIRD V1.1)
免疫数据库(PIRD)主要关注人体相关的免疫数据,收集了多种疾病的 BCR 和 TCR 测序数据,以及对应个体的实验信息、表型信息等。 该库一期已储存了 1923 份样本数据,554,696,060 条序列。PIRD 二期将整合更多的样本和数据,到 2017 年底样本将增长 5000 份,数据量增加至 10T, 可为疾病健康领域研究者和临床医生提供数据比对和可视化分析服务,解决缺少数据,缺少分析工具及分析门槛高等迫切需求。
病原数据库
Pathogen Variation Database (PVD)
病原数据库汇聚了各种病原微生物的基因数据及相关的注释信息,关注人源样本未知感染病原的鉴定及检测,提供快速、 全面的基因测序数据的病原鉴定功能,通过数据分析和可视化手段,一目了然的展示鉴定结果。同时还提供特殊关注的几种病原(HBV/HIV/HCV/HP) 的毒力鉴定和相关的耐药信息,为医患及研究者提供快速全面的病原检测服务。
单细胞数据库
Single Cell Database(SCDB)
单细胞数据库将创建人类细胞图集,对身体中所有类型甚至亚型的细胞进行编目,构建人类细胞完整清单,定义人类细胞,构建人体细胞框架图。目前,单细胞数据库汇集并展示了单细胞项目组 46 个样本,30854 个细胞,470G 单细胞数据。
海洋数据库
Marine Life Genome Database (MLGD)
集知识和分析的在线数据库平台。平台收集了当前已测序和发表的海洋生物基因组、转录组和蛋白质组数据。 并将这些数据及物种的基本信息依照海洋生物分类树组织起来。每个物种的基本信息包括:物种简介,参考文献,图片信息, 基因组信息和数据。目前,已收集 472547 个物种信息,7538 份基因组数据,25514 份图片信息。
BLAST
BLAST 是一个基于局部比对算法的序列搜索工具。BLAST 对一条或多条序列在一个或多个核酸或蛋白质序列库中进行比对。基于 NCBI BLAST 2.6.0 版本开发了深圳国家基因库的 BLAST 服务,支持了大部分 NCBI BLAST 数据库的序列比对,并用于 CNGB 的各公开数据的搜索,以提供广泛涵盖各个研究领域的、高效便捷的序列搜索服务。
国家基因库数据中心整合生物大数据资源,构建肿瘤疾病、人群多态性、动植物物种多样性、微生物等不同专题数据库及分析数据库系统,形成数据共享系统和社区,满足不同领域的研究人员需求,提升数据价值,促进数据开发应用。
生物多样性
1KITE:千种昆虫转录组进化研究数据库
B10K:万种鸟基因组数据库
FishT1K:千种鱼转录组数据库
MilletDB:谷子数据库
MLGD:海洋生物基因组数据库
OneKP:千种植物数据库
MT10K:万种线粒体数据库
ADD:农业数据库
10KP:万种植物数据库
健康与疾病
BDD:出生缺陷综合数据库
DHGV:人群多态性数据库
DISSECT:癌症数据集成与整合分析平台
GDRD:罕见病数据库
GeMap:人类组学信息系统
MDB:微生物组数据库
ICGC:ICGC 数据库中国镜像
PIRD:免疫数据库
PVD:病原数据库
SCDB:单细胞数据库
模块与服务
Biomigo:Biomigo
BLAST:CNGB高性能序列比对服务公开测试(v1.0)
CNSA:中国国家序列归档服务(未发布)
GigaDB:GigaDB