2024-07-29 102文献解读
要将全基因组关联研究(GWAS)的基因位点转化为因果变异和基因,需要从疾病相关组织中获得准确的细胞类型特异性增强子基因图谱。绘制增强子基因图谱至关重要,但目前在原代人体组织中采用的实验方法却极具挑战性。2024年4月,《Nature Genetics》发表了一种非参数统计方法SCENT(单细胞增强子目标基因图谱),其能在scRNA-seq或snRNA-seq和scATAC-seq数据中模拟增强子染色质可及性与基因表达之间的关联。
SCENT是一种统计方法,用于从单细胞多模式数据创建细胞类型特异性增强子基因图谱。其通过泊松回归和非参数引导,将增强子活性(即峰值可及性)与多模态单细胞中的基因表达联系起来,从而精确绘制增强子-基因对。
开发团队将SCENT应用于9个多模态数据集,其中包括大于120,000个单细胞或细胞核,并创建了23个细胞类型特异性增强子基因图谱。这些图谱高度富集了1,143种疾病和性状的表达定量位点和GWAS中的因果变异。开发团队确定了常见病和罕见病的可能致病基因,并将体细胞突变热点与目标基因联系起来,证明将 SCENT应用于与疾病相关的人体组织的多模态数据,能以可扩展的方式构建精确的细胞类型特异性增强子基因图谱,这对确定非编码变异的功能至关重要。
综上,尽管SCENT还存在一定局限性,但其优势在于在单细胞水平建模。SCENT模型的I型误差控制得很好,优于常用的统计模型;SCENT绘制的增强子对 eQTLs和GWAS中的假定因果变异具有高富集性,表现优于之前的方法。
与本文相关的计算脚本可在如下链接获取: https://github.com/immunogenomics/SCENT.
参考文献:Sakaue, S., Weinand, K., Isaac, S. et al. Tissue-specific enhancer–gene maps from multimodal single-cell data identify causal disease alleles. Nat Genet (2024). https://doi.org/10.1038/s41588-024-01682-1