Codeplot
scMCA
简介

scMCA是郭国骥团队开发的一种基于单细胞基因表达的定义老鼠细胞类型工具。基本的计算思路通过已知细胞类群中随机抽样100个细胞
平均表达值构建参考系,待测试细胞与参考细胞类群表达值计算Pearson相关系数,相关性最高的细胞类群作为判定依据。工具核心是>对应参考系构建。目前大型细胞图谱构建如the Mouse cell Atlas (MCA),the human cell landscape (HCL),the Non-Human Primate Cell Atlas (NHPCA);都采取类似方法。

本WDL工具扩展 scMCA 使用,新增内置 三个大型细胞图谱:the Mouse cell Atlas (MCA),the human cell landscape (HCL),the Non-Human Primate Cell Atlas (NHPCA);可通过修改 'ref'参数,切换对应图谱。

image

优势

通过抽样方式减少计算相关系数计算量,对应大型细胞图谱研究项目,计算速度大大提高并还能保证一定注释的准确性。

扩展(参考系构建介绍)

以MCA参考系为例,构建步骤如下:
为了构建一个scMCA参考文件,每个细胞被标准化成100k条转录本。对于每个细胞类型集群,随机选取100个单细胞,计算基因平均表达
值,DGE数进行取整。每个细胞集群,构建三次细胞类型转录组平均表达数据作为参考,得到894个主要的细胞类型。基于Seurat Wilcoxon算法执行每个细胞类型与所有其他细胞的差异表达分析,选取前10个标识基因(log-fold change > 1)。把每个细胞类型的标识合
并成30228个对组合功能基因列表,用来计算给定单细胞数据与每一个MCA参考细胞类型的相关系数。scMCA分析之前,log化单细胞的FPKM、RPKM和TPM的DGE矩阵。

参考

  1. Sun, Huiyu et al. “scMCA: A Tool to Define Mouse Cell Types Based on Single-Cell Digital Expression.” Methods in molecular biology (Clifton, N.J.) vol. 1935 (2019): 91-96. doi:10.1007/978-1-4939-9057-3_6
  2. Han, Xiaoping et al. “Mapping the Mouse Cell Atlas by Microwell-Seq.” Cell vol. 172,5 (2018): 1091-1107.e17. doi:10.1016/j.cell.2018.02.001
  3. Han, Xiaoping et al. “Construction of a human cell landscape at single-cell level.” Nature vol. 581,7808 (2020): 303-309. doi:10.1038/s41586-020-2157-4
  4. Han, Lei et al. “Cell transcriptomic atlas of the non-human primate Macaca fascicularis.” Nature vol. 604,7907 (2022): 723-731. doi:10.1038/s41586-022-04587-3

联系我们

该工具由国家基因库团队提供。如有任何问题或疑虑,请联系 cngbdb.org

脚本
输入
任务名称变量名称类型描述
* run_scmca.scmca refString 参考细胞图谱:MCA,HCL,NHPCA
* run_scmca.scmca csv_fileFile 输入表达矩阵文件,csv格式,行为基因,列为细胞,注意:矩阵基因名称与指定细胞图谱基因对应
* run_scmca.scmca tissueString NHPCA图谱的组织区域
输出
任务名称变量名称类型描述
* run_scmca heatmapFile 皮尔逊相关性系数热图
* run_scmca resultFile 细胞类型结果文件
* run_scmca pieString 细胞类型组成饼图