单细胞工具 | 利用CellHint自动协调和整合人类细胞图谱数据集的细胞类型

2024-02-21 1106文献解读

协调单细胞群体中的细胞类型,并将它们组装成一个共同的框架,是构建标准化人类细胞图谱的核心。2023年12月,《Cell》发表了一种基于树的预测聚类工具——CellHint,用于解决数据集之间在注释分辨率和技术偏差方面的细胞类型差异。

CellHint-1.png

CellHint是什么?

CellHin是一种基于树的预测聚类(PCT)工具,通过评估细胞-细胞相似性和统一细胞注释来有效地对齐多个数据集。在此基础上CellHint定义了细胞类型之间的语义关系,并捕捉到其潜在的生物学层次结构,从而进一步利用这些层次结构指导不同注释粒度的下游数据整合。

CellHint-2.png

CellHint的性能测试

开发团队已在49个数据集上应用了这一流程,证实了其在数据协调和整合方面的有效性,并为更广泛的领域提供了器官图谱和机器学习模型集,用于自动细胞类型注释。

CellHint协调概括人工注释

为了验证CellHint中的协调流程,开发团队选择了五个免疫数据集,尽管五个数据集中存在各种干扰因素,CellHint还是能够从两个互补的角度重建它们之间的细胞类型关系;CellHint还发现了以前被忽视的新细胞类型。

同时还收集了五个单细胞和单核数据集测试了CellHint处理单细胞转录组学范围之外的数据集的能力:CellHint揭示了高层次和低层次水平的42种和55种细胞类型,其中绝大多数与基于转录组的细胞类型比对相呼应。

CellHint-3.png

CellHint解开富含疾病的细胞状态

将CellHint应用到四个患病肺部数据集,成功地协调了不同区室中的细胞类型,解开了多种疾病中的异常细胞状态,揭示了其潜在的病理特征,并促进了转录组变化的全面研究。

CellHint-4.png

通过CellHint进行细胞重新注释和数据集成

通过CellHint统一模块对细胞进行重新标注后,CellHint还提供了一个整合模块,以调整数据结构,使之符合统一的细胞类型,同时以高效的方式减轻批次混杂因素的影响。

CellHint-5.png

CellHint组装了成人海马体的完整图谱

开发团队使用CellHint组装了六个单核转录组数据集,对成人海马体进行了分析,重建了51种细胞类型的全局空间图谱,根据分子和推断的空间信息绘制了详细的成人海马图,以帮助解释细胞类型。

CellHint-6.png

用于细胞协调、整合和分类的多器官参考图

开发团队总共编制了38个单细胞和单核转录组数据集,分析了来自369名成人捐献者12个组织和器官的3,694,864个细胞,包括血液、骨髓、心脏、海马、肠、肾、肝、肺、淋巴结 、胰腺、骨骼肌和脾脏。在CellHint中应用自动化流程后,生成了12个标准化器官参考图,可在https://www.celltypist.org/organs上获取。

CellHint-7.png

CellHint文档可在如下链接获取:https://cellhint.readthedocs.io/en/latest.

文献原文:
https://doi.org/10.1016/j.cell.2023.11.026.

上一篇下一篇