细胞数据信息采集标准
适用于单细胞转录组(scRNA-seq)、单核转录组(snRNA-seq)、单细胞ATAC(scATAC-seq) 及空间转录组(Spatial
Transcriptomics)的分析数据规范与质量标准。
标准介绍
本标准涵盖了从样本采集到数据分析的全流程规范,确保数据的一致性、可比性和可重复性。特别针对空间转录组技术,纳入了其产生的影像数据要求。
样本、切片说明
一并采集生物材料样本,对于空间转录组技术,还需提供组织切片的信息。
细胞数据结构
涵盖原始矩阵(不经过筛选)、处理矩阵以及补充文件。对于处理矩阵需标准化为 H5AD
文件,并固定内部插槽结构,以确保下游分析工具(如 Scanpy、CellxGene)的兼容性。
影像数据规范
空间转录组显微镜图像、配准图像以及细胞分割图像。

细胞数据质量指标
| 字段名称 | 说明 |
|---|---|
| cell / spot_count | 有效细胞 / spot 数量 |
| gene_count | 检测到的基因数量 |
| median_genes_per_cell / spot | 每个细胞 / spot 中检测到的基因数量的中位数 |
| mean_genes_per_cell / spot | 每个细胞 / spot 中检测到的基因数量的平均数 |
| median_umi_per_cell / spot | 每个细胞 / spot 检测到的 UMI(分子标签)数量的中位数 |
| mean_umi_per_cell / spot | 每个细胞 / spot 检测到的 UMI(分子标签)数量的平均数 |
| mean_umi_per_bin200 | Bin200 下平均 UMI 数 |
| mean_gene_type_per_bin200 | Bin200 下平均基因种类数 |
| mitochondrial_percentage | 线粒体基因比例 |
| ribosomal_percentage | 核糖体基因比例 |
| tissue_coverage | 组织覆盖率 |
| fraction_of_spots_under_tissue | 组织下的 spot 比例 |
| tissue_area_coverage | 组织面积覆盖率 |
| image_resolution | 图像分辨率 |
| image_contrast | 图像对比度(PSNR) |
| alignment_quality | 对齐质量 |
| low_quality_cell / spot_rate | 低质量细胞 / spot 占总检测细胞 / spot的比例 |
| cluster_marker_gene_specificity | 聚类标记基因特异性 |
| tissue_region_gene_expression_consistency | 组织区域-基因表达一致性 |
细胞数据采集模板下载