序列
序列数据库提供了多物种的核酸序列及蛋白序列的检索,数据源为 NCBI Refseq、Genbank、WGS、TSA 等数据库。主要信息包含序列名称、序列长度、物种、fastq 序列等。
最近更新
搜索字段和文本
| 搜索字段 | 搜索文本 |
|---|---|
| 标题(Title) | (SARS coronavirus)[Title] |
| 基因(Gene(s)) | (CFTR)[Gene(s)] |
| 物种编号(Organism ID) | (9606)[Organism ID] |
| 物种(Organism) | (Homo sapiens)[Organism] |
| 文献编号(Literature ID) | (PMID:6255410)[Literature ID] |
| 来源标识(Source) | (GU247585.1)[Source] |
数据源
序列库的数据来源主要为核酸序列归档系统归档的序列数据和 NCBI RefSeq、Genbank、WGS、TSA 等外源数据库的序列信息。CNGBdb 通过公开数据库 FTP 下载序列的数据资源,并将下载的数据按照一定的元信息结构进行解析整合后,在页面进行展示,为用户提供查询,检索和下载服务。每条序列数据(eg. https://db.cngb.org/data_resources/sequence/GU247585.1/),提供序列库原始 ID,可通过 ID 跳转回 NCBI 等来源库详情页。
CNGBdb 遵循数据来源库的数据使用协议及相关要求,如对上述引用方式有疑问或认为引用不合适等可联系 CNGBdb@cngb.org。
参考文献
- NCBI: Coordinators NR. Database resources of the National Center for Biotechnology Information. Nucleic Acids Research. 2018;46(D1):D8-D13.
- https://www.ncbi.nlm.nih.gov
- Benson DA1, Cavanaugh M, Clark K, et al. GenBank. Nucleic Acids Research. 2013 Jan;41(Database issue):D36-42. doi: 10.1093/nar/gks1195. Epub 2012 Nov 27.
- Pruitt KD1, Tatusova T, Maglott DR. NCBI reference sequences (RefSeq): a curated non-redundant sequence database of genomes, transcripts and proteins. Nucleic Acids Research. 2007 Jan;35(Database issue):D61-5. Epub 2006 Nov 27.
- Burley SK Berman HM, Bhikadiya C, et al. RCSB Protein Data Bank: biological macromolecular structures enabling research and education in fundamental biology, biomedicine, biotechnology and energy. Nucleic Acids Research. 2019 Jan 8;47(D1):D464-D474. doi: 10.1093/nar/gky1004.