2024-03-19 126文献解读
由于固有的低信噪比和存在过多的缺失值,单细胞测序(scRNA-seq)数据分析存在独特的挑战。2024年2月,《Scientific Reports》发表了一种新的基于卷积神经网络(CNN)的方法——cnnImpute,旨在解决scRNA-seq中数据缺失的问题。
cnnImpute是一种基于CNN的新插补方法,旨在恢复缺失值。其使用伽马正态分布来估计丢失概率,重点是只输入那些丢失可能性很高的表达式值。与标准神经网络中的完全连接层相比,基于CNN的方法在不牺牲信息的情况下有效地降低输入数据的高维性,并支持参数共享,从而提高效率并简化训练。
通过综合评估,cnnImpute证明了其在scRNA-seq数据分析中准确输入缺失值的有效性,同时保持了细胞簇的完整性,在各种对标实验中取得了优异的性能。
在两个真实的 scRNA-seq 数据集将cnnImpute与其他插补方法(ALRA、bayNorm、DCA、DeepImpute、MAGIC、SAVER、scGNN、scImpute、scVI 和 SDImpute)进行比较:cnnImpute 在各种数据集上始终表现出可靠的准确性。
与使用原始数据形成的聚类相比,cnnImpute生成的估算数据提高了细胞聚类的质量,如所有三个数据集的纯度、熵和ARI得分的增强所示,表明其在改进细胞类型识别方面的有效性。综合测评结果表明,scVI和cnnImpute是改进细胞聚类检测的两种最稳定的插补方法。
在模拟数据和真实数据中cnnImpute均表现出改进下游差异表达分析方面的有效性。
在对 cnnImpute 进行评估并与其他现有估算方法进行比较的 17 次实验中,cnnImpute 始终表现出卓越的稳定性和性能,在不同数据集的不同评估中获得了最高排名。
cnnImpute的方法说明请参考文献原文Methods:https://doi.org/10.1038/s41598-024-53998-x.
参考文献:
Zhang, W., Huckaby, B., Talburt, J. et al. cnnImpute: missing value recovery for single cell RNA sequencing data. Sci Rep 14, 3946 (2024).