2021-04-02 1919文献解读
新兴的空间转录组(ST)领域的技术发展开辟了一个未经探索的领域,将转录信息置于空间环境中。聚类通常是分析这类数据的核心组成部分。然而,在这些类型的分析中,选择适当的超参数,例如使用正确数量的聚类,是一个挑战。
来自瑞典和美国的科研团队开发了SpatialCPie,一个易于使用的R包,可以让用户直观地了解ST数据中的“簇”是如何相互关联的,以及二维ST阵列上的每个区域与每个“簇”的关联程度。
SpatialCPie被设计成R工作流的一部分,使用户可以高度灵活地定制和快速迭代他们的分析。数据在多种分辨率下进行聚类--即采用不同数量的聚类或超参数设置--从而避免了为分析预先指定单一的超参数集,用户可以自由定义使用哪种聚类算法。结果以两种方式可视化:用聚类图显示不同分辨率之间的聚类重叠情况;用二维数组图,其中每个点用饼图表示,表示其与不同聚类中心点的相似度。
SpatialCPie的用户界面是用Shiny实现的。该界面主要由两部分组成:Cluster graph和Array plot。
聚类图(图1,左)是一个可视化的图,可以显示不同分辨率之间的聚类重叠情况。“簇”在图中表示为节点,而边缘则表示连续分辨率中“簇”的重叠程度。
二维数组图(图1,右),每个“斑点”的饼图显示了“斑点”和“簇”中心点之间的相似度得分。饼状图将聚类分配关系化,从而有可能识别基因表达的空间趋势。
在ST数据的典型分析中,经常会出现这样的情况,即组织中的某些部分明显地以低分辨率聚类,对进一步的探索作用不大。同时,通过Sub-clustering对其他区域进行更细致的研究可能得出有意义的结论。这可通过反复使用该工具来实现。
SpatialCPie可以用来分析任何具有空间分布的计数数据的数据集,开发团队展示了其在三个公开的ST数据集(发育中的人类心脏、原位乳腺癌和黑色素瘤)上的实用性,在此之前所有数据均使用Seurat进行了归一化。
以发育中的人类心脏为例,组织切片取自5周大的心脏,具有明确的解剖区域(图2b)。Array plot(图2a)和Cluster graph(图2c)显示出流出道、心房和心室之间在不同分辨率下的明显分离。流出道的均匀性也很明显;它的大部分“斑点”都表现出与单个聚类(cluster 2)的高度相似性,并且该聚类在颜色空间中与其他聚类明显分离。
有证据表明,心室中基因表达存在细微差异,但“簇”之间的颜色和共同祖先表明彼此之间的“簇”比其他“簇”更相似(图2c)。心室的Sub-clustering (图3)显示了横跨组织外周紧凑的心室肌。此外,开发团队还发现左心室和右心室表现出略微不同的聚类亲和力,这表明它们的差异可能是一个值得进一步研究的有趣特性。
SpatialCPie为分析ST数据的聚类提供了一个用户友好的界面,并使用可视化技术帮助分析人员发现和探索隐藏的基因表达模式。
SpatialCPie下载地址:https://github.com/jbergenstrahle/SpatialCPie.
参考文献
Bergenstråhle J, Bergenstråhle L, Lundeberg J. SpatialCPie: an R/Bioconductor package for spatial transcriptomics cluster evaluation[J]. BMC bioinformatics, 2020, 21: 1-7.
图片来源于BMC bioinformatics官网和参考文献,如有侵权请联系删除。