BASS:为单细胞分辨率的空间转录组学提供多尺度和多样本分析

BASS:为单细胞分辨率的空间转录组学提供多尺度和多样本分析

空间转录组学研究正在达到单细胞空间分辨率,数据通常来自多个组织切片。《Genome biology》发表了一种计算方法BASS,支持单细胞分辨率空间转录组学的多尺度和多样本分析。BASS在单细胞尺度上进行细胞类型聚类,在组织区域尺度上进行空间结构域检测,这两项任务在贝叶斯层次结构模型框架内同时进行。 BASS是什么? 目前用于细胞类型聚类和空间结构域检测的方法存在两方面的局限性:1)所有现有方法仅执行两个分析任务中的一个,有效地使两个不同解剖尺度的分析相互分离;2)所有现有方法都集中于分析从单个组织切片收集的空间转录组学数据。基于此,开发团队提出了一种新的计算方法BASS,用于多尺度和多样本分析,克服了上述两个限制。 BASS以联合细胞类型聚类和空间结构域检测的形式进行多尺度转录组学分析,这两项分析任务在贝叶斯分层建模框架内同时执行。对于这两种分析,BASS适当考虑了空间相关性结构,并将基因表达信息与空间定位信息无缝集成,以提高其性能。此外,BASS能够进行多样本分析,联合建模多个组织切片/样本,促进跨组织样本的空间转录组学数据整合。BASS进行多尺度和多样本分析,以便在空间转录组学中进行准确的细胞类型聚类和空间域检测。BASS接受来自多个组织切片的基因表达矩阵和空间位置信息的输入,并在一个分级贝叶斯框架中对这两种信息进行建模。在分析中,BASS将组织上每个细胞的细胞类型标签(c)和空间结构域标签(z)作为潜在/隐藏的变量,并通过一个有效的推理算法推断它们。分析后,BASS提供推断出的细胞类型集群标签、空间结构域标签和每个空间结构域内的细胞类型比例作为输出结果。 BASS的性能测试 开发团队通过对三个数据集的全面模拟和应用来说明BASS准确地揭示大脑皮层和下丘脑的转录组和细胞景观的巨大优势。   模拟数据首先,开发团队评估了不同方法在单个组织切片上进行空间结构域检测的性能:在模拟中发现BASS在所有场景中都优于HMRF、BayesSpace和SpaGCN。 接下来,评估了不同方法在单个组织切片上细胞类型聚类的性能:在模拟中发现BASS在所有场景中都优于SC3、Seurat和FICT,当细胞类型在组织上显示空间模式时,BASS优于其他三种方法的优势尤其明显。 最后评估了BASS在多个组织切片综合分析中的性能:在所有模拟场景中所有三个分析任务(包括空间结构域检测、细胞类型聚类和跨域细胞类型组成估计)的BASS性能随着分析组织切片数量的增加而增加。对于细胞类型聚类,Seurat的性能也随着分析的组织切片数量的增加而增加,而SC3的性能先增加,然后随着组织切片数量增加而降低。与单个组织切片分析类似,当细胞类型在组织上显示出空间模式时,BASS相对于其他方法在细胞类型聚类上的优势尤其明显 除了上述的主要模拟,开发团队还探讨了其他各种因素,包括特定细胞类型/空间结构域的数量、稀有的细胞类型、以及随机排除基因对不同方法性能的影响。    小鼠内侧前额叶皮层的STARmap数据首先,开发团队检查了不同方法对空间结构域检测的结果:BASS检测到的四个空间结构域与预期的皮质层高度相似(ARI=0.82)。相比之下,HMRF(ARI=0.57)、BayesSpace(ARI=0.26)和SpaGCN(ARI=0.36)检测到的空间结构域与基本事实基本不匹配,方法的排名与模拟数据中观察到的基本一致。此外,BASS检测到的四个皮质层之间有很好的隔离,它们之间有平滑的边界,而BayesSpace和SpaGCN检测到的皮质层在某种程度上交织在一起。值得一提的是,BASS的多样本综合分析能力进一步提高了用于一个样本分析的同一组织切片上的空间结构域检测精度。此外,与我们在焦点样本中发现的情况类似,BASS在单切片和多切片分析中都准确地捕捉到了其他两个切片的四个空间结构域,比其他方法更准确。这些结果证实了BASS在空间结构域检测和多样本综合分析方面的优越性。 接下来检验了不同方法细胞类型聚类的结果:单个组织切片上与模拟一致,BASS实现了准确的细胞类型聚类(ARI=0.44),比Seurat(ARI=0.34)、SC3(ARI=0.37)和FICT(ARI=0.27)更准确;BASS的多样本分析也优于其他两种细胞类型聚类方法(Seurat和SC3)。    小鼠下丘脑的MERFISH数据首先,开发团队检查了不同方法对空间结构域检测的结果:BASS检测到与基础组织学注释高度相似的主要空间结构域(ARI=0.58)。相比之下,由HMRF(ARI=0.42)、BayesSpace(ARI=0.12)和SpaGCN(ARI=0.19)检测到的空间结构域通常与基本事实不匹配。重要的是,利用BASS对五个相邻空间转录组组织切片进行多样本综合分析,进一步深入了解了下丘脑视前区的结构组织,这是其他方法的单样本分析无法实现的。 接下来检验了不同方法细胞类型聚类的结果:单个组织切片上与模拟一致,BASS实现了准确的细胞类型聚类(ARI=0.46),比Seurat(ARI=0.37)、SC3(ARI=0.35)和FICT(ARI=0.34)更准确。使用BASS的多样本分析产生了与Bregma-0.14的单个切片分析类似的细胞类型聚类准确度(ARI=0.49)。使用Seurat的多样本分析改进了单个切片分析(ARI=0.42),而使用SC3的多样本研究与单个切片分析相比产生了较低的细胞类型聚类性能,这可能是由于其性能随着细胞数量的增加而降低(如前所述,ARI=0.33)。三种方法的多个切片与单个切片分析的比较与模拟结果一致,突出了BASS的优势。   人背外侧前额叶皮层的10x Visium数据在单个切片分析中,BASS检测到与大多数组织切片的基本组织学注释高度相似的主要空间结构域(跨切片的平均ARI=0.48),比HMRF(平均ARI=0.30)、BayesSpace(平均ARI=0.44)和SpaGCN(平均AR1=0.40)更高。重要的是,对来自每个成人供体的四个组织切片的综合分析进一步改进了空间结构域检测(中值ARI=0.51),并在四个切片上产生了一致的空间结构域。用BASS进行的多样本综合分析大大改善了这个特定样本的空间结构域的检测,并产生了与基础注释高度相似的皮质层,而且在所有四个切片中都是一致的(ARI = 0.60)。在其他两组组织切片中也可以进行类似的观察,证实了BASS在非单细胞分辨率空间转录组学中的空间结构域检测和多样本综合分析的性能。 在运行时间和内存使用方面,BASS与其他空间结构域检测方法和细胞类型聚类方法相当。对于典型的10x Visium数据,大约5000个点,BASS需要大约8分钟,并使用2GB内存。此外,BASS的运行时间和内存使用量与数据的样本大小呈线性关系,这使得BASS可扩展到分析成千上万个细胞/点。  尽管BASS、HMRF和BayesSpace都采用了Potts模型,但BASS在Potts模型的基础上引入了额外的分层建模结构,以便进行灵活和有效的空间转录组建模。与HMRF和BayesSpace相比,额外的分层建模结构使BASS能够对空间结构域的组成做出根本性的不同和更有效的假设。BASS在分层建模结构中引入了细胞类型组成作为中间层,以明确地模拟不同细胞类型的不同基因表达。因此,BASS能够将一个空间结构域定义为具有独特细胞类型组成的区域,以更好地捕捉每个空间结构域内的基因表达异质性,并实现更好的性能。此外,BASS根据现有数据推断Potts模型中的空间相互作用参数β,而HMRF和BayesSpace则将该参数改为用户指定的值。BASS中对β的推断也有助于提高其性能。最后,从模型推理的角度来看,尽管BASS和BayesSpace都是基于贝叶斯框架,但BASS使用Swendsen-Wang算法对空间结构域标签进行采样,而BayesSpace使用Gibbs采样算法。Swendsen-Wang算法比Gibbs采样算法有更好的混合率,因此也有助于BASS实现更好的准确性。 在必要的预处理步骤之后,BASS也可以应用于其他空间转录组学技术,例如HDST和Seq-Scope。 BASS在未来有几个重要的扩展。例如开发团队主要侧重于使用基因表达数据作为输入,但注意到BASS建模框架是灵活的,可以很容易地以额外特征输入的形式纳入组织学图像的信息,以进一步提高其性能。另一个例子是用主成分分析(PCA)中归一化基因表达矩阵的低维成分作为BASS的输入,且BASS并不局限于PCA,它可以与其他降维方法配对,以其低维分量作为输入。 此外,BASS检测到的准确的细胞类型和空间结构域可以与许多其他分析工具配对,以进一步改善各种下游应用,揭示更多的生物学见解,例如与SpatialCorr配对,以检测组织区域内或组织区域之间具有协调调节的基因。 BASS 是作为 R 包实现的, BASS 软件以及用于重现本研究中呈现的所有分析结果的代码可在 GitHub 和 Zenodo 上免费获得: > https://github.com/zhengli09/BASS> https://doi.org/10.5281/zenodo.6814510​参考文献Li Z, Zhou X. BASS: multi-scale and multi-sample analysis enables accurate cell type clustering and spatial domain detection in spatial transcriptomic studies[J]. Genome biology, 2022, 23(1): 1-35.图片来源于Genome biology官网和参考文献,如有侵权请联系删除。 

空间转录组
工具
2023-01-12
1174
5

Nat Biotechnol | SPOTS:一种允许在完整组织中大规模同时测量蛋白质标记物和全转录组的新方法

Nat Biotechnol | SPOTS:一种允许在完整组织中大规模同时测量蛋白质标记物和全转录组的新方法

空间转录组学和蛋白质组学提供了互补信息,改变了我们对复杂生物过程的理解。然而,这些模式的实验整合是有限的。为了克服这个问题,近日《Nature Biotechnology 》发表了一种允许在完整组织中大规模同时测量蛋白质标记物和全转录组的新方法:SPOTS,用于高通量同步空间转录组和蛋白质分析。SPOTS是什么? SPOTS是一种多模式方法,可以同时记录整个转录组和大量蛋白质信息,同时保留组织结构。SPOTS使用Visium slide的poly(A)捕获技术,同时通过DNA条形码抗体(聚(腺苷化)抗体衍生标签(ADTs)测量细胞内/外蛋白质水平,如CITE-seq和mRNA表达。再结合使用>30个蛋白标记的补充Visium转录组分析,SPOTS以高度可重复性的方式产生了优越的细胞类型、生物过程和表型的组织图谱。(步骤1)将组织切片安装到Visium玻片上,固定10min,并用荧光和TotalSeq-A抗体(相同克隆)免疫染色(步骤2)90min, 同时存在poly-T阻断低聚物,以防止非特异性ADTs与载玻片表面结合。清洗后,在扫描显微镜下扫描组织以捕获组织结构和基准点(步骤3)。然后对组织进行渗透(步骤4),RNA扩散到空间条形码上的poly-T寡核苷酸上。在组织消化(步骤5)和模板切换RT-PCR(步骤6)之后,生成基因表达和ADT文库,以保存相关的空间条形码和RNA序列/ADT抗体条形码(步骤7)。对基因表达和ADT文库进行测序,并使用指定的管道整合数据(步骤8)。 SPOTS的性能测试SPOTS优化了对小鼠脾脏的测定,其包含不同的细胞群体,这些细胞群体被划分为生发中心(GC)、边缘区(MZs)和红髓/间质区的明确结构。与相应的mRNA相比,蛋白质共表达模式显示出更强的相关性结构;一般而言,细胞类型特异性mRNA都被有效捕获。 将SPOTS的表现与单独的Visium、SM-Omics或Guilliams等团队的技术进行了比较,其中Guilliams等开发的技术将TotalSeq-A抗体与ST技术集成。结果表明:与单独使用Visium相比,SPOTS产生了相当大的mRNA捕获,并大大提高了集成的mRNA + ADT捕获的性能,包括检测到的基因和ADT的数量、信号分辨率、细胞聚类和跨组织区域基因表达的发现能力。SPOTS在整合转录组和蛋白质的空间映射能力显著提升。 SPOTS揭示了乳腺癌TME中两个空间上不同的巨噬细胞。开发团队使用MMTV-PyMT转基因小鼠模型将SPOTS应用于鼠类乳腺肿瘤。为了表征TME内的空间相互作用和基因表达异质性,首先进行了细胞类型去卷积分析,并揭示了富含不同水平免疫细胞和基质细胞的不同肿瘤和瘤周区域。然后通过使用基于加权最近邻(WNN)的多模态集成方法发现,与mRNA相比ADT模态对聚类分配的影响更大。因此,通过整合ADT和mRNA模式,SPOTS为紊乱和具有挑战性的组织(如实体瘤)中的免疫细胞群提供了更精确的分子表征。最后检查了两个富含巨噬细胞/髓系标记物的区域,相关空间数据表明,M2巨噬细胞在肿瘤边界形成免疫抑制屏障,导致免疫衰竭和逃避。 总之,SPOTS是一种允许在完整组织中大规模同时检测蛋白质标记物和全转录组的方法。SPOTS 的未来发展将包括与新兴的更高分辨率ST技术的进一步整合,以及捕获细胞中的体细胞突变、绘制TCR谱图或捕获体内扰动,这将进一步增强我们对免疫微环境中细胞间相互作用的理解。(步骤1)将组织切片安装到Visium玻片上,固定10min,并用荧光和TotalSeq-A抗体(相同克隆)免疫染色(步骤2)90min, 同时存在poly-T阻断低聚物,以防止非特异性ADTs与载玻片表面结合。清洗后,在扫描显微镜下扫描组织以捕获组织结构和基准点(步骤3)。然后对组织进行渗透(步骤4),RNA扩散到空间条形码上的poly-T寡核苷酸上。在组织消化(步骤5)和模板切换RT-PCR(步骤6)之后,生成基因表达和ADT文库,以保存相关的空间条形码和RNA序列/ADT抗体条形码(步骤7)。对基因表达和ADT文库进行测序,并使用指定的管道整合数据(步骤8)。   Data and Code availability 👉 本研究中产生的所有原始数据均已存入GEO,数据编号:GSE198353。 👉 本研究中使用的组织高分辨率图像可在Figshare网站上获得:https://figshare.com/account/home#/projects/143019 👉 为了方便访问SPOTS计算流程,可以在GitHub找到相关R包(点击阅读原文可直接访问):https://github.com/stevexniu/spots参考文献Ben-Chetrit, N., Niu, X., Swett, A.D. et al. Integration of whole transcriptome spatial profiling with protein markers. Nat Biotechnol (2023). https://doi.org/10.1038/s41587-022-01536-3 

空间转录组
技术
2023-01-09
459
4

空转工具盘点 | 空间转录组细胞类型聚类方法综合比较

空转工具盘点 | 空间转录组细胞类型聚类方法综合比较

此前小编已经为大家整理过 👉 10款空间转录组去卷积工具的综合比较,除了去卷积,聚类也是空转数据分析中的关键步骤。近日,《Briefings in Bioinformatics》发表了综述文章,根据聚类性能、鲁棒性、计算效率和软件可用性对七个软件工具提供的15种聚类方法进行了综合测试。 测试数据集及算法信息为了全面评估不同聚类方法的性能,研究团队基于不同技术准备了七个具有真实位置信息的空间转录组学数据集。同时设计了一个RShiny程序,使用真实数据提供的空间位置并考虑到预定的空间模式,将真实细胞类型标签分配给模拟数据中的单个细胞(或点)。对于采用组织学染色的空间转录组学方法,研究团队模拟了红色、绿色和蓝色 (RGB) 的像素值,以反映真实的 H&E 颜色范围和真实的细胞类型分配。研究团队将聚类方法视为把观察到的空间转录组学数据作为输入和输出聚类标签的函数和/或算法的集合。在本研究中,比较了以下七种软件工具提供的 15 种聚类方法。 测试结果聚类精度:Seurat-LVM、SpaGCN和Seurat-LV总体上是最准确的聚类方法。使用来自空间坐标和组织学图像的附加信息的方法并不能系统地优于仅使用基因表达信息的方法。 不同测序深度下的稳健性:考虑到测序深度降低到50%,基于Seurat的方法是最稳健的方法。同样,结合空间或组织学信息不能保证提高现有方法的聚类鲁棒性。 聚类参数的鲁棒性比较:在要求用户指定聚类数量的方法中,SpaGCN、SpaGCN+ 和 Giotto-H 在给定错误的指定参数值时保持最高的平均聚类精度。 组织学图像对变异的鲁棒性比较:对于以组织学图像为输入的聚类方法(stLearn、SpaGCN+、SpaCell和SpaCell-I),当提供质量更好的图像时,它们没有表现出明显的改善。 软件使用:基于Seurat和SpaGCN的方法具有最佳的计算效率,Seurat、SpaCell和stLearn具有最佳的软件支持。 为了阐明真实数据上的方法性能,研究团队还比较了五个真实空间转录组学数据集上15种方法的聚类精度,将原始出版物中报告的细胞类型标签作为评估聚类结果的参考。从这些结果中,发现Seurat SLM、BayesSpace、Giotto LD、Giotto-H和SpaGCN分别在真实数据集1到5上具有最佳的聚类精度。当比较数据集中不同方法的相对性能时,发现在不需要组织学图像的方法中,基于Seurat的方法、BayesSpace和SpaGCN具有最佳的准确性。此外,在依赖组织学图像作为输入的方法中,SpaGCN+和stLearn的排名相似,都优于基于SpaCell的方法。这些结果与模拟数据的观察结果一致。   空间转录组学数据提供的额外空间和组织学信息为发展聚类方法开辟了新的途径,我们确实观察到在选定数据集中细胞群体识别的准确性提高。然而,未来仍有许多待解决问题,包括如何在噪声的情况下更有效地结合空间和组织学信息,以及如何减轻聚类对用户指定的聚类数或其他聚类参数的依赖等。参考文献Chen J, Liu W, Luo T, et al. A comprehensive comparison on cell-type composition inference for spatial transcriptomics data. Brief Bioinform. 2022 Jun 27:bbac245. 图片均来源于参考文献,如有侵权请联系删除。

空间转录组
工具
2023-01-03
495
4

空转应用篇 | 空间转录组学为肠道的理解增加了新维度

空转应用篇 | 空间转录组学为肠道的理解增加了新维度

肠粘膜的深刻复杂性需要一种空间方法来研究肠道转录组学。《美国生理学杂志:胃肠和肝脏生理学》发表了一篇Mini-Review,描述了最近应用于肠道的空间转录组学技术以及其新发现。 由于胃肠道令人难以置信的细胞多样性,剖析肠粘膜内细胞的特性、功能和内部运作一直是一项持续的技术挑战。转录组学一直是理解肠粘膜复杂工作的重要工具。然而,大量甚至单细胞RNA测序缺乏空间信息,并且由于单个组织和细胞类型的多样性,可能会错过肠道内细胞身份和基因表达的许多细节。在这篇综述将描述空间转录组学中的新技术如何通过沿着近端-远端和隐窝绒毛轴绘制基因表达来克服这些挑战,从而为我们对肠粘膜内基因表达的理解增加了新的维度。  空间转录组技术在肠道研究中的应用在GI研究中,两种最常见的空间转录组学方法使用了激光捕获显微切割(LCM)或基于玻片的原位捕获技术。 为了解决这些技术的有限细胞分辨率,最近的文献将slide-based转录组学或LCM与单细胞RNA测序相结合,以推断单细胞分辨率的空间信息。空间转录组技术在肠道研究中的应用主要体现如下几个方向:1)通过LCM鉴定肠上皮细胞标志基因,可沿隐窝绒毛轴对上皮细胞进行空间测序;2)scRNA-seq与LCM或slide-based转录组学配对揭示了以前未知的非上皮粘膜细胞功能;3)Slide-based转录组学绘制了发育和再生肠道的新细节。  空间转录组学的局限性灵敏度是空间转录组学和scRNA-seq等技术的固有问题,因为每个样本中目标 RNA 的绝对丰度较低,并且需要大量的总reads数才能为数千个单独的载玻片点或细胞实现足够的读取深度。例如组织覆盖率为50%的10X Visium载玻片上,1.25亿read pairs对应的每个点只有5万read pairs。在该深度测序的小鼠组织的Visium公共数据集产生了约4500个独特的基因,是源组织中发现的约20000个独特蛋白质编码基因的一小部分。这些数据可能会遗漏关键但低表达的转录物,例如转录因子或细胞表面受体。对于大多数单细胞测序平台,建议的每个细胞测序深度与10X Visium平台中单个点的测序深度相当。因此,这里讨论的所有技术都将在测序灵敏度方面存在类似的不足。解决方案可能可使用超分辨率显微镜结合荧光原位杂交,或 seqFISH+。 分辨率是最常见的空间转录组学技术的另一个主要障碍。10X Visium 的光斑直径约为 50 微米,这意味着单个光斑包含多个细胞。激光捕获显微解剖通常也仅限于多细胞斑点的切除。最近的技术(例如Seq-scope)大大提高了这一分辨率,但它们的使用还没有那么广泛,尤其是在 GI 研究中。  可及性可能是许多GI研究人员考虑将空间转录组学用于他们自己研究的主要关注点。许多空间转录组学技术需要专门的设备,并且数据处理依赖于广泛的计算知识。对于刚接触空间转录组学的研究人员来说,适应现有普通技术可能是最容易入门。在计算方面,有许多新方法提供空间转录组学和单细胞数据的简化计算集成,如去卷积算法Tangram、DIALOGUE或STRIDE等。  肠道具有定型的隐窝绒毛结构,其独特组织、细胞类型和细胞状态的复杂网络是空间测序研究的理想候选者。最近的工作使用了slide-based转录组学或激光捕获显微解剖,单独或与scRNA-seq结合,为我们了解肠细胞的身份和功能打开了新的维度。在众多的发现中,这些研究已经确定了成熟上皮肠细胞中的转分化和蛋白质-mRNA 不一致,间充质细胞和淋巴细胞的绒毛尖和隐窝小生境旁分泌功能,以及整个再生肠道中不同的并发转录特征。然而,肠道空间转录组学仍然是一个处于起步阶段的领域。单细胞水平的空间信息仍然是通过计算推断的,测序深度仍然是一个长期存在的问题。新的方法有望在保留精确空间信息的情况下识别单个细胞内的数千个基因,但这些技术仍然难以执行,尚未广泛应用于GI研究。随着新技术变得越来越普遍和普及,未来的工作将克服这些技术挑战,并利用产生的大量数据来回答肠道内稳态和疾病领域以前无法回答的问题。参考文献Danan C H, Katada K, Parham L R, et al. Spatial transcriptomics add a new dimension to our understanding of the gut[J]. American Journal of Physiology-Gastrointestinal and Liver Physiology, 2022.图片均来源于参考文献,如有侵权请联系删除。

空间转录组
科研应用
2022-12-22
554
2

NC | Bulk2Space:以空间单细胞分辨率对RNA-seq数据进行从头分析

NC | Bulk2Space:以空间单细胞分辨率对RNA-seq数据进行从头分析

以单细胞分辨率揭示组织分子结构有助于更好地了解生物体的生物学和病理过程。然而,bulk RNA-seq 只能测量细胞混合物中的基因表达。《Nature Communications》发表了一种基于深度学习框架的空间去卷积算法:Bulk2Space,首次实现将Bulk转录组重构至单细胞空间分辨率。 Bulk2Space是什么? Bulk2Space是一种基于深度学习框架的空间去卷积算法,该算法使用现有的高质量scRNA-seq数据和空间转录组学作为参考,从bulk RNA-seq中生成空间解析的单细胞表达谱。 Bulk2Space分为去卷积和空间映射两个步骤:首先在聚类空间内生成单细胞转录组数据,以找到一组细胞,其聚合数据与批量数据最接近。接下来,使用空间转录组参考将生成的单个细胞分配到最佳空间位置。 Bulk2Space的性能测试 研究团队使用bulk RNA-seq数据验证 Bulk2Space的性能,其揭示了不同肿瘤区域免疫细胞的空间差异、炎症诱导肿瘤发生过程中组织的分子和空间异质性以及不同细胞类型中新基因的空间模式。此外,Bulk2Space对研究团队内部开发的称为Spatial-seq的测序方法的两个不同小鼠大脑区域的bulk RNA-seq数据进行空间去卷积分析,不仅重建了小鼠等皮质的层次结构,还进一步注释了小鼠下丘脑中原始方法未识别的细胞类型。尽管每次β-VAE生成的单细胞数据略有不同,但总体预测结果在细胞类型的空间分布、细胞类型组成和斑点比例以及基因表达的空间模式方面表现稳健。 利用Bulk2Space对Spatial-seq技术获得的小鼠下丘脑bulk转录组进行空间解卷积及细胞类型注释。  Bulk2Space具有巨大的生物学和临床应用前景,包括将组织分子特征与组织学表型联系起来,揭示细胞的空间特异性变异,发现新基因的空间表达模式,实现更精细的细胞聚类,以及预测疾病进展的分子机制。 Bulk2Space算法可在GitHub上开放访问: https://github.com/ZJUFanLab/bulk2space参考文献Liao J, Qian J, Fang Y, et al. De novo analysis of bulk RNA-seq data at spatially resolved single-cell resolution[J]. Nature communications, 2022, 13(1): 1-19.部分信息来源于“浙江大学药学院”公众号,图片来源于Nature communications官网和参考文献,如有侵权请联系删除。 

空间转录组
工具
2022-12-12
551
2

Nature子刊 | 空间转录组技术及其发展方向

Nature子刊 | 空间转录组技术及其发展方向

2022年10月《Nature Biotechnology》发表了一篇空间转录组(ST)技术的综述文章,详细描述了现有的ST技术及其发展方向。检测生物分子的新技术一直是生物进步的关键驱动力。在检测生物分子时,研究人员在选择实验方法时一直面临着关键的权衡。一方面,“组学”工具可以对纯化样本中的许多生物分子进行广泛而全面的检测。另一方面,一套靶向工具(如免疫染色或原位杂交),可以在完整的细胞和组织中定位特定分子(通常数量较少)。因此,研究项目通常将这两个阶段结合在一起:研究人员首先使用“组学技术”提出假设,然后进行有针对性的、假设驱动的工作,以描述特定基因或蛋白质在感兴趣的完整组织中的作用。 最近ST技术的快速发展正在颠覆这种方法学上的历史分歧。这些工具能够对完整组织切片中转录组的RNA进行量化。广义而言,ST最适合回答三种生物问题:首先可以阐明组织的细胞类型组成;第二类问题与细胞相互作用有关;最后可以帮助阐明组织成分之间的分子相互作用。 ST技术“基于测序的ST”(sST)sST技术通常从构建空间索引表面开始,其中每个pixel都包含一个条形码DNA引物,该引物在二维空间中唯一标记pixel的位置。然后将组织放在表面的顶部,通过RNA从组织扩散到表面或条形码引物扩散到组织,使驻留的mRNA与引物接触。通常,在其3′末端带有poly(T)序列的引物用于捕获转录组中的mRNA。常见的方法有10x Genomics Visium、Slide-seq、Stereo-seq 、DBiT-seq等。 在sST中两个最重要的质量参数是单位面积的mRNA捕获灵敏度和mRNA检测的空间精度。此外,测序效率和该技术所覆盖的空间区域也是描述和比较sST技术的附加参数。  “基于成像的ST”(iST)在iST中,RNA分子通过互补杂交用荧光探针进行特异性标记。然后使用荧光显微镜对这些探针进行成像。为了克服光谱限制,最近的iST方法通常使用多轮连续成像和组合策略来检测转录本。因此,特定的iST方法很大程度上取决于检测方式、RNAs分子的标记方式和多路复用方法,或者通过连续成像轮检测多个RNA转录物的方式。这些方法主要是由三个领域的进展推动的:寡核苷酸合成、荧光显微镜和单细胞转录组学。ST中使用了三种主要的原位标记RNA分子的策略:基于直接探针的检测、基于酶辅助探针的检测和原位RNA分子的直接酶测序。在图像处理中使用三个主要步骤来生成主要ST数据:斑点检测、图像配准和解码为空间mRNA定位。常见的iST技术有smFISH、MERFISH、STARMap等。 在iST中两个关键的数据质量参数是敏感性和特异性。鉴于特定技术的检测、多路复用和图像处理的具体条件,需要评估这些参数。 ST技术的预计开发方向 ST技术的高速进展预示着基因组学正在向完整细胞和组织研究的更广泛技术转变。支持ST(高通量DNA测序、新型条形码策略、新的显微镜工具和分子酶学创新)的工具将越来越多地允许基因组学用于回答细胞和组织生物学中的问题。预计技术开发将在三个主要领域进行: 适用于其他模式现代基因组学通过酶和生化操作与DNA测序的创造性结合开发了一系列令人印象深刻的生物分子检测技术。然而,大多数技术只能在从组织或细胞中提取和纯化的基质上在体外使用。使基因组学技术在完整组织切片中发挥作用是生物学发现的巨大机会。预计ST技术在量化转录物方面取得的进展将越来越多地应用于其他形式的基因组检测。例如,iST最近被用于通过靶向内含子来量化新生mRNA,这种方法同样可以通过靶向外显子-外显子连接来量化剪接变异。目前,亚型变异的发现需要长读长技术和/或基于平板的方法来评估。未来长读长流程或靶向亚型原位测序的适应应该能实现空间域的可扩展适应。 除了转录组,基因组变异的空间分析已经开始被探索,但工具仍然相对落后。现有的技术主要是通过成像来测量基因组结构,但最近也报道了基于测序的策略。这些技术也可以用于研究表观基因组的修饰和调控,其将在癌症突变分析中应用,基因组变异的空间分析可能有助于阐明体细胞突变与衰老和疾病的功能相关性。 空间方法也可能提供一个机会来统一基因组学和蛋白质组学。尽管基因组学传统上侧重于分离检测,但用亲和试剂对蛋白质定位的查询长期以来一直是在原位低多重性下进行的。最近在亲和试剂(如抗体)的DNA条形码方面的发展,已经通过测序实现了高度多重化的蛋白质readouts。这些方法很容易适应空间域,特别是在空间捕获ST检测的背景下。在不久的将来,整个蛋白质组亲和文库(包括抗体、纳米体和适配体)可以在原位使用和检测。此外,基于邻近性的酶反应,如连接和聚合酶延伸,可以实现组织内高通量蛋白质-蛋白质、DNA-蛋白质和RNA-蛋白质相互作用的测量。最后,利用单分子成像的新型蛋白质测序方法在许多方法上都有了快速发展;有一天,这可能会允许在组织中直接进行蛋白质测序。   提升分辨率当前的空间基因组方法涵盖了从组织区域到亚细胞定位的广泛空间分辨率,在组织的体积通量和收集的数据空间分辨率之间进行了总体权衡。不同的空间分辨率适用于不同类别的生物问题。对测量的转录物进行细胞分割的能力对于许多下游应用至关重要,例如量化细胞类型和组织组成。在sST和iST中,分割都是一个计算问题。对于sST,它涉及从一个pixel对细胞型混合物的去卷积;当pixel大小减小到单个细胞的大小时,问题就简单多了。对于iST,计算任务是从显微镜图像中将单独检测到的转录物组装成细胞。这两方面的努力都取得了进展,但额外的计算创新将大大加快ST工具应用于组织生物学问题的能力。 在组织组成之后,提高分辨率将使组织组成能够考虑到细胞间的相互作用。基本问题包括如何提取构成组织的相关细胞网络?而且,如何发现细胞之间的功能性受体-配体相互作用网络?这些问题最适合具有细胞分辨率或更高分辨率的技术,以便能够将分子特征准确分配给相互作用的细胞网络。 此外,能够实现生物分子精确原位共定位的技术(可能在超过衍射极限的分辨率下)仍然几乎完全未被探索。一个有趣的例外是几个小组提出使用具有局部连接的原位PCR扩增来检测两个核酸之间的空间接近度。从转录因子结合位点的定量到生物分子共定位到特定的细胞器隔室或间隙连接或其他细胞-细胞相互作用的定量,原位分子共定位的方法将在生物学上具有极大的可行性。  细胞动力学的观察空间基因组技术和合成基因操作方法在分子记录方面的交叉尤其有前景。最近,已经描述了许多基于基因编辑的分子记录技术,这些技术将谱系和信号动力学编码到基因组序列中。这些方法利用单细胞测序来读取基因组信息。鉴于单细胞和sST 之间化学性质的内在相似性,谱系的基因组记录可以很容易地转化为组织环境。这种测量对于发育生物学很重要,其中有关细胞谱系、细胞状态和成人组织组成的信息可以同时组合以形成发育图谱。在肿瘤进化中,这些方法可以回答有关肿瘤克隆的空间异质性以及肿瘤克隆适应度与细胞微环境之间关系的重要问题。除了谱系之外,新的记录技术开始对细胞历史和转录组状态进行编码,这可能为使用基因组学对细胞状态进行全四维测量提供了希望。 关于动力学的计算推断,最近用于单细胞研究的计算工具数量激增,例如伪时间和RNA速度。针对单个细胞开发的方法已成功应用于ST数据,例如将RNA速度应用于发育中的小鼠皮层ST。然而,未来面向空间的计算动力学工具箱的开发将更直接地利用ST数据的独特方面。人们可以利用RNA的亚细胞定位来推断有关动力学的额外时间信息。更重要的是,空间信息可以在伪时间分析中提供背景事实,例如使用细胞定位来分配细胞轨迹中的节点。 最后,扰动允许从点测量中推断因果关系。最近的方法使核酸条形码能够对单细胞readouts的遗传和化学扰动进行编码。与分子记录类似,扰动条形码方法可能与空间捕获方法固有地兼容。此外,通过原位测序读取条形码已被证明可用于成像方法。使用 ST 分析原位遗传扰动的影响将能够分析在没有组织背景的情况下无法访问的表型。这些表型很多,包括细胞定位和细胞-细胞相互作用。参考文献Tian, L., Chen, F. & Macosko, E.Z. The expanding vistas of spatial transcriptomics. Nat Biotechnol (2022). https://doi.org/10.1038/s41587-022-01448-2图片均来源于参考文献,如有侵权请联系删除。

空间转录组
综述文章
2022-11-28
516
2

Life Med综述 | 时空组学技术在病理应用中的革命性意义

Life Med综述 | 时空组学技术在病理应用中的革命性意义

近日,中国科学院院士、陆军军医大学第一附属医院病理科主任卞修武院士,以色列魏茨曼科学研究院Ido AMIT教授联合华大生命科学研究院徐讯研究员及西南团队,在国际期刊Life Medicine 上发表综述《Spatiotemporal Omics-Refining the landscape of precision medicine》。这也是西南华大生命科学研究院、金凤实验室和金凤·华大时空组学中心的首个合作成果。该文章总结了当前已报道的时空组学技术的优缺点,描述了该类技术在肿瘤发病机制的应用进展,阐明了时空组学技术在包括病理检测应用等在内的精准医学领域中的革命性意义,同时也指出了临床数据计算所面临的挑战。 当前,精准医学主要使用组织形态学和分子信息来指示个体表型和基因型。就发病机制复杂的肿瘤疾病而言,病理学是指导其治疗和预后的“金标准”,多维信息的整合阐明其发病机制。但目前的临床诊断及评估手段,无法完整地揭示各患者临床表现、病程及预后。 新兴的时空组学技术能够很好地弥补并突破该局限。其在识别特定细胞的同时,显示出与病理诊疗相关的重要分子标志物信息,揭示肿瘤异质性、发病机制,从而进一步推动精准医学。具体而言,时空多组学技术能够实现在组织空间位置上探究复杂人类疾病(特别是癌症)发展发生、进展的分子变化机制,帮助绘制疾病时空图谱(肿瘤异质性、肿瘤微环境)及疾病时空分化蓝图。文章阐述了致力于解决肿瘤和非肿瘤疾病的时空异质性的代表性研究,如肿瘤空间结构(三级淋巴结构、侵袭性前缘)和生态系统(肿瘤微环境),以及非肿瘤疾病的空间特征等。  空间多组学技术的前世今生 文章提及,解析组织空间基因表达信息的方法在近几年内大量涌现,但其捕捉到的信息量并不足以描述复杂的生理、病理过程。因此,空间多组学方法的开发迭代至关重要。根据捕获空间信息方式的不同,空间多组学技术主要分为三类,包括基于成像的RNA和蛋白质共检测方法,如CODEX(Co-Detection by Indexing)和SMI(CosMxTM Spatial Molecular Imager);基于测序技术的ST(Visium)和Stereo-seq(SpaTial Enhanced REsolution Omics sequencing),以及基于显微解剖的LCM(laser capture microdissection)和sciMAP-ATAC、DSP(GeoMx Digital Spatial Profiler)。对于未来的空间组学技术而言,将时间维度纳入其中进行迭代,并进一步提高其分辨率和通量十分关键。   分析算法助力分子水平精准医学 目前,空间多组学数据分析面临的主要挑战是实现对海量数据的正确处理和解释,以及多维数据的统一标准。精准医学的目标是为每个人进行个性化的治疗。实现这一目标需要整合组学数据、临床影像、生化检测数据、病史、精神状况等海量的个性化数据。值得关注的是,肿瘤疾病是高度异质性的,不同患者治疗后的免疫反应和结果不同。能够在分子水平上检查病理组织,并呈现准确的空间信息,这对了解生物标志物的分布,监测疾病的发展和预后具有重要意义。 文章简要介绍了常见的空间多组学数据分析算法,包括细胞空间聚类、细胞注释、基因模块分析、细胞互作分析等,以及它们在病理分析中的应用。未来,空间多组学的整合分析必将提供对组织结构、基因表达模式和细胞-细胞通信的深入理解,以帮助临床疾病的诊疗,并在分子水平上促进精准医学的发展。   时空多组学推动精准医学“进度条” 自2015年时任美国总统奥巴马在国情咨文中提出“精准医学计划”后,我国将精准医学正式纳入“十三五”经济规划,并提出“促进精准医学的创新和工业化”,这极大推动了国内精准医学的发展。比如,今年6月份在重庆揭牌的金凤实验室和金凤·华大时空组学中心,是全球首个时空多组学病理研究中心。 时空多组学已被证实可用于揭示胚胎发育、组织分化、器官发生和病理变化的分子机制,可实时监测基因和蛋白的表达动态,并反映细胞-细胞通讯;可在肿瘤发病机制研究中解析肿瘤的空间结构及其微环境。但时空多组学技术的临床应用转化也面临着诸多挑战,其中鉴别诊断和患者分层为首要挑战。文章由此提出,转录组学、蛋白质组学、形态学和潜在的表观遗传学的联合应用十分有前景,因为多组学、跨尺度的分析能够提供详细的基因表达和定位信息,可有效改善临床诊疗效果,助力精准医学发展。 华大生命科学研究院徐讯研究员,中国科学院院士、陆军军医大学第一附属医院病理科主任卞修武院士,以色列魏茨曼科学研究院Ido AMIT教授为该文共同通讯作者。西南华大生命科学研究院张佳君博士、华大生命科学研究院殷建华博士为该文共同第一作者。参考文献https://doi.org/10.1093/lifemedi/lnac053 

空间转录组
综述文章
2022-11-23
2573
2

NC发布猕猴大脑皮层多组学细胞图谱,助力神经系统疾病研究 | 时空专辑数据库

NC发布猕猴大脑皮层多组学细胞图谱,助力神经系统疾病研究 | 时空专辑数据库

 近日,杭州华大生命科学研究院(以下简称杭州华大)联合昆明理工大学灵长类转化医学研究院、美国艾伦脑科学研究所等国内外多家单位在国际学术期刊《自然·通讯》(Nature Communications)在线发表题为《成年猕猴大脑皮层空间分辨基因调控和疾病易感性图谱》的文章,首次发布了猕猴大脑皮层多组学细胞图谱,为人类神经发育和神经类疾病研究提供重要模型。该研究是杭州华大继今年发布的全球首个高分辨率蝾螈脑再生图谱后又一项在脑科学研究领域的代表性成果。此项研究的原始数据已存储于国家基因库生命大数据平台(CNGBdb),项目编号为:CNP0000927。同时,研究团队还提供了一个用于探索的开放交互式数据库:猕猴大脑皮层多组学细胞图谱(MBA)。# MBA非人灵长类动物的大脑发育和病理特征在系统发育上与人类接近。在过去十年中,单细胞测序的突破性进展使得能够绘制不同哺乳动物发育和成年大脑的细胞分类学和异质性图谱。MBA包含来自成年猕猴大脑三个皮质区域的358,237个细胞的单细胞染色质可及性(scATAC-seq)和单细胞转录组(scRNA-seq)数据。同时将该数据集与相应皮层区域的Stereo-seq数据相结合,把位置信息分配给分子和调控状态。 期刊:Nature Communications数据编号:CNP0000927数据库:https://db.cngb.org/mba/ 大脑可能是人体最复杂的器官之一了,它是人体生命活动的中枢,控制着我们的思想、语言、行为、情感等。然而,脑科学与脑疾病难题也是人类所面临的重大挑战。揭示人脑运作原理,进而解决重大脑疾病威胁,依赖于对大脑组成和功能的认知。  首个猕猴大脑多组学图谱发布 为人类大脑结构解析奠定基础推进大脑的实验需要一个实验载体。过去,大家会选择用小鼠、果蝇等来研究大脑,但它们在进化上与人相距甚远。非人灵长类动物与人类在解剖结构、组织器官功能等方面极为相近,而猴类是实验动物里最高等的,也是进化上最靠近人的,比如猕猴等。 猕猴的大脑皮层组织在许多方面与人类相似,系统分析猕猴大脑皮层细胞的表达调控机制,对脑及神经性疾病模型研究具有重要的指导意义,也为深入了解脑科学的复杂机制提供珍贵资源。 本研究基于华大智造DNBelab C4单细胞建库测序平台和华大自主研发的时空组学技术Stereo-seq,对成年猕猴大脑开展了单细胞染色质可及性测序、单细胞核转录组测序,并进行了时空组学分析,最终发布了猕猴大脑皮层的单细胞染色质可及性图谱、转录组图谱以及空间图谱。这是首次对外发布猕猴大脑皮层的细胞多组学信息,为绘制猕猴大脑的精细图谱提供基础。 为了深入探索大脑不同脑区的细胞表达情况,研究团队对猕猴大脑的3个重要脑区初级视皮层(视觉处理)、初级运动皮层(自主运动的控制)以及前额皮质(高级认知功能,比如学习、语言、决策、抽象思维、情绪等)脑组织中单个细胞的基因表达及状态,空间信息进行了联合分析,发现了这三个脑区细胞类型的组成,定义了其特定细胞类型的调控机制,并解析了非人灵长类动物大脑不同皮质区域中兴奋性神经元的基因表达模式,为今后研究大脑不同功能区域间的神经联结机制提供了分子蓝图。   解密神经系统疾病易感性 助力脑疾病研究及药物研发作为身体各个部位的指挥员,神经系统可以分为中枢神经系统和周围神经系统;前者包括我们的脑和脊髓,仿佛“中央司令部”一般,负责综合后者“报告”来的各路信息,并做出决策,指挥后者执行。这些信息在单个神经元中都以电信号的方式传递——神经元的轴突们就像一根根导线,而髓鞘就是它们的“绝缘皮”,促进电信号更快更好地传递。 髓鞘的重要组成少突胶质细胞在这一过程中发挥着重要作用。神经退行性疾病(比如老年痴呆、帕金森综合征等)和神经发育障碍(包括多发性硬化症)患者经常会出现髓鞘再生障碍。 本研究构建了少突胶质前体细胞向少突胶质细胞分化的路径,发现Wnt调控通路(蛋白质作用网络,最常见于胚胎发育和癌症)在少突胶质细胞成熟路径中的基因表达状态及表达水平的协同变化,同时标记出脱髓鞘疾病的潜在靶点,为脱髓鞘疾病后续的治疗提供可能的方向。 研究团队还利用统计学方法预测了不同细胞类型的神经系统疾病的风险易感性,发现严重抑郁障碍和精神分裂症等神经精神疾病主要与神经元有关,阿尔茨海默病与小胶质细胞相关。精神分裂症相关基因变异显著富集定位于第二三层IT型兴奋性神经元和SST型抑制神经元,但仅与M1脑区中第五第六层的IT型兴奋性神经元相关。 作者发现严重抑郁障碍主要与PFC和M1中的神经元相关。相反,自闭症障碍主要与M1的兴奋性神经元相关。相关结果为研究这类神经系统疾病提供了参考方向。“针对重大脑疾病的发生发展和药物研究的需求日渐激增,非人灵长类动物模型现已成为脑科学研究领域的核心。” 文章第一作者、华大生命科学研究院雷莹博士表示,“华大联合全球多个顶级机构发布的高分辨率的非人灵长类动物猕猴大脑的多组学图谱,将为脑科学研究和神经系统疾病的新药研发提供重要基础。” 如今,美国、欧盟、日本、中国等都将脑科学上升为国家科技战略的重点,相继开展了脑科学计划。中国脑计划(脑科学与类脑科学研究)与其他国家启动的脑科学研究计划相比,所包含的内容更广泛,也更关注社会需求。华大自主研发的时空组学技术Stereo-seq,目前已在胚胎发育、器官再生、疾病研究等领域取得了重要成果,此次在猕猴脑图谱研究中取得的成功,也展示了其应用于中国脑计划的远大前景。华大生命科学研究院徐讯研究员、刘石平研究员、刘龙奇研究员、侯勇研究员,昆明理工大学灵长类转化医学研究院牛昱宇教授以及美国艾伦脑科学研究中心Zeng Hongkui博士为文章的共同通讯作者。华大生命科学研究院雷莹副研究员、成梦南博士、吴亮博士、华南理工大学庄镇堃博士、中国科学院大学李子豪博士、孙雨浓博士为文章的共同第一作者。参考文献:Lei, Y., Cheng, M., Li, Z. et al. Spatially resolved gene regulatory and disease-related vulnerability map of the adult Macaque cortex. Nat Commun 13, 6747 (2022). https://doi.org/10.1038/s41467-022-34413-3预览时标签不可点  

空间转录组
数据库
2022-11-21
538
3

EmAtlas:探索哺乳动物胚胎发育时空动态的综合图谱

EmAtlas:探索哺乳动物胚胎发育时空动态的综合图谱

胚胎发育研究的重要性日益显现,这迅速增加了与多组学数据相关专业资源的数量。然而,缺乏全球胚胎发育库和系统分析工具,限制了干细胞研究、人类先天性疾病和辅助生殖领域的发展。2022年10月,《Nucleic Acids Research》发表了一种名为EmAtlas的数据库,收集了最全面的多组学数据,并提供了多尺度工具来探索哺乳动物胚胎发生过程中的时空动态。  EmAtlas是什么? EmAtlas收集了最全面的哺乳动物发育多组学数据,致力于探索胚胎发生的时空动态,可用于发现新的潜在组织生物标志物,分析细胞异质性,浏览时空表观遗传图谱和生物学通路,探索先驱性蛋白因子的功能域和结构。 EmAtlas包含了多种类型的基因表达、染色质可达性、DNA甲基化、核小体占位、组蛋白修饰和转录因子的数据,显示了小鼠和人类在几个时间点的完整时空景观,涉及配子发生、植入前,甚至胎儿和新生儿,每个组织都涉及各种细胞类型。为了表征哺乳动物胚胎发生过程中涉及组织、细胞、基因组、基因和蛋白质水平的特征,还开发了这五种尺度的分析工具。此外,开发团队建议 EmRanger 提供广泛的与发育相关的生物背景注释。  EmAtlas有哪些功能? 基于用户友好的界面,用户可利用EmAtlas实现分析、浏览、可视化和数据下载等功能。EmAtlas提供了描述哺乳动物胚胎发育的五种尺度的分析工具,包括组织、细胞、基因组、基因和蛋白质,并允许用户探索不同阶段的发育相关熵、生物通路、相互作用网络和细胞/组织生物标记物。 用户可以访问 EmRanger,并在文本框中键入或粘贴包含一个或多个基因名称的列表。或者,可以上传基因列表文件。然后,检测基因并使用它们的 Ensembl ID、基因型和其他信息进行注释。最后将上述数据提交给后端服务器进行分析。分析完成后,将生成在线分析报告。  EmAtlas 的一个典型应用是探索潜在的跨物种组织发育调节因子。以胎儿大脑的发育为例。Single Cell Cluster工具显示,神经元是人类和小鼠胎儿大脑的主要细胞类型,其百分比超过80%(上图A)。因此,我们专注于神经元发育,并确定了人和小鼠共有的神经元特异性高变异基因(HVG)。EmRanger分析结果表明,这些HVG主要富集于与神经系统和大脑发育相关的一些生物过程中(上图B)。这些HVG的失调可导致疾病的发生,如多动症、散发性癫痫和异常的脑形态发生。上述分析表明,人和小鼠之间可能存在类似的神经元发育机制,表明将小鼠作为人类神经发育疾病的模型动物是可行的。随后,选择了神经元中特异表达的四个代表性基因(Stmn2、Tuba1a、Gpm6a和Tagln3)(上图C)。Stmn2、Tuba1a和Gpm6a已被证实在早期神经发生和维持神经元形态方面发挥关键作用。 Tagln3在先前的研究中被认为是泛神经元标记,但在神经发育过程中 Tagln3 的时空表达模式和动态表观基因组景观仍然缺乏特征。EmAtlas进一步证明Tagln3在小鼠脑组织中特异性表达,包括前脑、中脑、后脑和神经管,其中神经管的表达水平最高(上图D,E)。值得注意的是,Tagln3在第13.5天在胎儿神经管中达到最大表达水平,然后逐渐下降,直到出生后阶段(上图F)。此外,Tagln3 启动子的高染色质可及性与H3K27ac和H3K4me1的沉积平行,从第11.5天到第15.5天甲基化水平低,在神经管发育过程中显示出明显的表观基因组动力学(上图G)。值得注意的是,H3K27ac 在第13.5天在神经管中显著富集,与第13.5天神经管中Tagln3的高表达水平一致。这些结果表明,Tagln3可能是塑造神经系统早期发育的关键调节因子。 总的来说,EmAtlas 为实验生物学家提供资源和理论指导,以识别潜在的调节因子并破译它们在胚胎发生过程中细胞命运决定中的分子机制。 综上所述, EmAtlas不仅为哺乳动物胚胎发育提供了全面的时序多组学资源,而且还设计了一个云平台和一系列工具,用于在多个尺度上理解哺乳动物胚胎发育。 未来,EmAtlas将不断更新多组学资源和分析策略,为发育生物学、再生医学、辅助生殖和先天性疾病提供更详细的指导。 EmAtlas: http://bioinfor.imu.edu.cn/ematlas参考文献Zheng L, Liang P, Long C, et al. EmAtlas: a comprehensive atlas for exploring spatiotemporal activation in mammalian embryogenesis[J]. Nucleic Acids Research, 2022.图片来源于Nucleic Acids Research官网和参考文献,如有侵权请联系删除。 

空间转录组
数据库
2022-11-14
1161
2

BT × IT | DeepST:通过深度学习识别空间转录组学中的空间域

BT × IT | DeepST:通过深度学习识别空间转录组学中的空间域

识别空间域(即在基因表达和组织学上具有空间相关性的区域)是空间转录组学中最重要的课题之一。近日,《Nucleic Acids Research》发表了一个准确且通用的深度学习框架:DeepST,用于识别空间域。 DeepST是什么? DeepST是一个可定制的ST深度学习框架,可以准确识别空间域。DeepST使用预先训练好的深度神经网络模型从形态学图像块中提取特征向量,然后将提取的特征与基因表达和空间位置数据整合,以表征空间相邻点的相关性,并创建空间增强的基因表达矩阵。DeepST使用图神经网络(GNN)自动编码器和去噪自动编码器联合生成增强ST数据的潜在表示,而域对抗神经网络(DAN)用于整合来自多个批次或不同技术的ST数据。 (A) DeepST工作流程从ST数据开始,以苏木精和伊红(H&E)染色(可选)、空间坐标和空间基因表达作为输入。(B) DeepST最初使用H&E染色来收集组织形态学信息,然后使用预先训练的深度学习模型,根据与相邻斑点的相似性,对每个斑点的基因表达进行标准化。通过该矩阵计算相邻点之间的形态相似性,并将基因表达权重和空间位置权重合并,为点内的每个基因重新分配一个增强的表达值。(C) DeepST生成三个网络框架,其中一个去噪自动编码器网络和一个变分图自动编码器用于提取最终的潜在嵌入,一个域鉴别器用于融合来自不同分布的空间数据(红色虚线框,该部分仅用于整合任务)。 DeepST的性能测试开发团队对不同平台(如10×Visium、Slide-seqV2和Stereo-seq)生成的ST数据作为基准,将DeepST与现有算法进行了广泛的测试和比较。DeepST还可以处理基于成像的分子数据(例如MERFISH、4i和MIBI-TOF),特别是在MERFISH数据上提取三维(3D)表达域。通过对乳腺癌ST数据集的进一步测试,DeepST识别了视觉上同质肿瘤区域内的异质子区域,这些子区域在传统的肿瘤内结果中未检测到。综上所述,DeepST在准确识别空间域方面具有强大的能力,在处理其他空间组学数据方面也具有可扩展性。为了评估DeepST识别空间域的性能,开发团队使用10×Visium ST基准数据集(背外侧前额叶皮质(DLPFC)),将DeepST与两种非空间算法(K-means和Seurat)和四种最近发布的空间聚类算法(stLearn、SpaGCN、SEDR和BayesSpace)进行了比较,结果表明DeepST识别的空间域与DLPFC的手动注释和神经科学中皮质分层的定义相一致,其性能优于现有方法。 同时,开发团队还进一步评估了DeepST在10×Visium小鼠脑组织数据集中识别空间域的有效性,并将DeepST识别的空间域与Allen mouse brain Atlas脑解剖参考注释进行了比较。DeepST可清楚地检验与参考注释一致的脑结构;当空间域的数量不是先验时,DeepST 自适应计算最佳聚类分辨率;确定相同数量的空间域时,DeepST 还展示了其识别空间域的卓越能力和高效性能。 DeepST可以在更精细的水平上剖析癌症组织的空间结构域:在乳腺癌(浸润性导管癌)的公共ST数据上,DeepST获得的域与手动注释高度一致。与其他空间算法识别的域相比,DeepST发现的区域具有更多的区域连续性和更少的噪声。在另一个人类乳腺癌(原位导管癌)的ST数据上,DeepST域比其他空间算法更流畅、更连续,这反映了DeepST处理对复杂组织进行精细分割的能力。此外,DeepST还能够识别具有不同生物功能的精细区域。除了10×Genomics Visium平台之外,开发团队还研究了DeepST对基于成像的分子数据(MERFISH、4i和MIBI-TOF)和高分辨率ST数据(Stereo-seq和Slide-seqV2)的适配能力,结果表明DeepST适用于不同平台的各种空间组学数据。 DeepST的模型构造非常灵活。首先,它提供了多种图形神经网络类型供用户选择。其次,DeepST在参数选项中为用户提供不同ST平台的多种预设选择。最后,DeepST相邻图的参数调整允许用户对空间信息确定不同的权重,以便准确识别空间域。此外,DeepST计算速度快,内存利用率高。在后续的工作中,开发团队将进一步考虑模型的适用性和收敛稳定性的必要性。 DeepST算法的代码和详细教程可在如下链接获取: https://github.com/JiangBioLab/DeepST参考文献Xu C, Jin X, Wei S, et al. DeepST: identifying spatial domains in spatial transcriptomics by deep learning. Nucleic Acids Res. 2022 Oct 17:gkac901.图片来源于Nucleic Acids Res官网和参考文献,如有侵权请联系删除。  

空间转录组
工具
2022-11-10
24
2