序列
序列数据库提供了多物种的核酸序列及蛋白序列的检索,数据源为 NCBI Refseq、Genbank、WGS、TSA 等数据库。主要信息包含序列名称、序列长度、物种、fastq 序列等。
最近更新
搜索字段和文本
搜索字段搜索文本
标题(Title)(SARS coronavirus)[Title]
基因(Gene(s))(CFTR)[Gene(s)]
物种编号(Organism ID)(9606)[Organism ID]
物种(Organism)(Homo sapiens)[Organism]
文献编号(Literature ID)(PMID:6255410)[Literature ID]
来源标识(Source)(GU247585.1)[Source]
数据源

序列库的数据来源主要为核酸序列归档系统归档的序列数据和 NCBI RefSeq、Genbank、WGS、TSA 等外源数据库的序列信息。CNGBdb 通过公开数据库 FTP 下载序列的数据资源,并将下载的数据按照一定的元信息结构进行解析整合后,在页面进行展示,为用户提供查询,检索和下载服务。每条序列数据(eg. https://db.cngb.org/data_resources/sequence/GU247585.1/),提供序列库原始 ID,可通过 ID 跳转回 NCBI 等来源库详情页。

CNGBdb 遵循数据来源库的数据使用协议及相关要求,如对上述引用方式有疑问或认为引用不合适等可联系 CNGBdb@cngb.org。

参考文献
  1. NCBI: Coordinators NR. Database resources of the National Center for Biotechnology Information. Nucleic Acids Research. 2018;46(D1):D8-D13.
  2. https://www.ncbi.nlm.nih.gov
  3. Benson DA1, Cavanaugh M, Clark K, et al. GenBank. Nucleic Acids Research. 2013 Jan;41(Database issue):D36-42. doi: 10.1093/nar/gks1195. Epub 2012 Nov 27.
  4. Pruitt KD1, Tatusova T, Maglott DR. NCBI reference sequences (RefSeq): a curated non-redundant sequence database of genomes, transcripts and proteins. Nucleic Acids Research. 2007 Jan;35(Database issue):D61-5. Epub 2006 Nov 27.
  5. Burley SK Berman HM, Bhikadiya C, et al. RCSB Protein Data Bank: biological macromolecular structures enabling research and education in fundamental biology, biomedicine, biotechnology and energy. Nucleic Acids Research. 2019 Jan 8;47(D1):D464-D474. doi: 10.1093/nar/gky1004.