Back to top
Pubmed数据下载说明
Last modified: 2025-04-29 10:54:06
PubMed数据说明
FTP下载地址:https://ftp.cngb.org/pub/ncbi/pubmed
PubMed是由NCBI (美国国家生物技术信息中心) 提供的文献数据库,包含与生物医学相关的文献记录。
本专区定期更新PubMed的数据。
数据来源: https://ftp.ncbi.nlm.nih.gov/pubmed
文件目录说
baseline 数据集
内容: 包含PubMed文献的基线数据,每年12月发布,包含2025年之前所有PubMed的文献。
文件格式:
.xml.gz
:压缩的XML文件,包含文献的元数据和摘要。.md5
:文件的MD5校验和,用于验证文件完整性。
updatefiles 数据集
内容: 包含PubMed文献的更新数据,包含2025年的最新文献。
文件格式:
.xml.gz
:压缩的XML文件,包含新增或更新的文献记录。.md5
:文件的MD5校验和,用于验证文件完整性。
文件结构说明
XML文件结构
根元素:
<PubmedArticleSet>
:包含多个<PubmedArticle>
元素。
主要元素:
<PubmedArticle>
:代表一篇文献。<MedlineCitation>
:文献的元数据。<PMID>
:文献的唯一标识符(PubMed ID)。<Article>
:文献的详细信息。<Journal>
:期刊信息。<ArticleTitle>
:文献标题。<Abstract>
:文献摘要。<MeshHeadingList>
:MeSH主题词列表。<PubmedData>
:PubMed数据。<History>
:文献的出版历史。<PublicationStatus>
:文献的出版状态。
通过解析XML文件,可以获取文献的标题、摘要、作者、期刊等信息。
注意事项
- 我们同步的数据全部来自NCBI(美国国家生物技术信息中心)的公开数据库PubMed。所有数据均通过NCBI官方提供的接口或下载渠道获取。
- 请按照NCBI的规定引用相关数据。
- 平台会定期更新NCBI数据,如希望更新数据,可以联系我们。
- 用户使用NCBI的数据,需严格遵守NCBI的相关政策:https://www.ncbi.nlm.nih.gov/home/about/policies/。若发现内容存在侵权行为,请及时与我们联系,我们会删除相关内容。
- 具体的说明以NCBI的官方文档https://ftp.ncbi.nlm.nih.gov/pubmed/README.txt为准。
联系方式
如果有其他问题(如新增数据库需求或数据使用疑问),欢迎随时联系我们:
- 联系邮箱:CNGBdb@cngb.org
- 联系电话:0755-3394 5586