聚类精度:Seurat-LVM、SpaGCN和Seurat-LV总体上是最准确的聚类方法。使用来自空间坐标和组织学图像的附加信息的方法并不能系统地优于仅使用基因表达信息的方法。
不同测序深度下的稳健性:考虑到测序深度降低到50%,基于Seurat的方法是最稳健的方法。同样,结合空间或组织学信息不能保证提高现有方法的聚类鲁棒性。
聚类参数的鲁棒性比较:在要求用户指定聚类数量的方法中,SpaGCN、SpaGCN+ 和 Giotto-H 在给定错误的指定参数值时保持最高的平均聚类精度。
组织学图像对变异的鲁棒性比较:对于以组织学图像为输入的聚类方法(stLearn、SpaGCN+、SpaCell和SpaCell-I),当提供质量更好的图像时,它们没有表现出明显的改善。
软件使用:基于Seurat和SpaGCN的方法具有最佳的计算效率,Seurat、SpaCell和stLearn具有最佳的软件支持。
为了阐明真实数据上的方法性能,研究团队还比较了五个真实空间转录组学数据集上15种方法的聚类精度,将原始出版物中报告的细胞类型标签作为评估聚类结果的参考。从这些结果中,发现Seurat SLM、BayesSpace、Giotto LD、Giotto-H和SpaGCN分别在真实数据集1到5上具有最佳的聚类精度。当比较数据集中不同方法的相对性能时,发现在不需要组织学图像的方法中,基于Seurat的方法、BayesSpace和SpaGCN具有最佳的准确性。此外,在依赖组织学图像作为输入的方法中,SpaGCN+和stLearn的排名相似,都优于基于SpaCell的方法。这些结果与模拟数据的观察结果一致。