/
/
/
Pubmed数据下载说明

Pubmed数据下载说明

Last modified: 2025-04-29 10:54:06


PubMed数据说明

FTP下载地址https://ftp.cngb.org/pub/ncbi/pubmed

PubMed是由NCBI (美国国家生物技术信息中心) 提供的文献数据库,包含与生物医学相关的文献记录。

本专区定期更新PubMed的数据。

数据来源: https://ftp.ncbi.nlm.nih.gov/pubmed

文件目录说

baseline 数据集

内容: 包含PubMed文献的基线数据,每年12月发布,包含2025年之前所有PubMed的文献。

文件格式:

  • .xml.gz:压缩的XML文件,包含文献的元数据和摘要。
  • .md5:文件的MD5校验和,用于验证文件完整性。

updatefiles 数据集

内容: 包含PubMed文献的更新数据,包含2025年的最新文献。

文件格式:

  • .xml.gz:压缩的XML文件,包含新增或更新的文献记录。
  • .md5:文件的MD5校验和,用于验证文件完整性。

文件结构说明

XML文件结构

根元素:

  • <PubmedArticleSet>:包含多个 <PubmedArticle> 元素。

主要元素:

  • <PubmedArticle>:代表一篇文献。
    • <MedlineCitation>:文献的元数据。
      • <PMID>:文献的唯一标识符(PubMed ID)。
      • <Article>:文献的详细信息。
        • <Journal>:期刊信息。
        • <ArticleTitle>:文献标题。
        • <Abstract>:文献摘要。
      • <MeshHeadingList>:MeSH主题词列表。
    • <PubmedData>:PubMed数据。
      • <History>:文献的出版历史。
      • <PublicationStatus>:文献的出版状态。

通过解析XML文件,可以获取文献的标题、摘要、作者、期刊等信息。

注意事项

  1. 我们同步的数据全部来自NCBI(美国国家生物技术信息中心)的公开数据库PubMed。所有数据均通过NCBI官方提供的接口或下载渠道获取。
  2. 请按照NCBI的规定引用相关数据。
  3. 平台会定期更新NCBI数据,如希望更新数据,可以联系我们。
  4. 用户使用NCBI的数据,需严格遵守NCBI的相关政策:https://www.ncbi.nlm.nih.gov/home/about/policies/。若发现内容存在侵权行为,请及时与我们联系,我们会删除相关内容。
  5. 具体的说明以NCBI的官方文档https://ftp.ncbi.nlm.nih.gov/pubmed/README.txt为准。

联系方式

如果有其他问题(如新增数据库需求或数据使用疑问),欢迎随时联系我们: