如何从Hi-C数据中快速分析影响疾病的DNA结构?

2020-01-15 23912动手实验室

Hi-C,一种衍生于染色体构象捕获技术(3C)的高通量技术,实现了全基因组范围内染色体片段间相互作用的捕获检测,可得到染色体三个层级的三维结构:A/B compartment、拓扑相关结构域(TAD)、染色质环(loop)。

其中大多数调控相互作用被认为发生在TADs中,而TADs结构功能与疾病的发展相关,包括一些癌症,例如破坏TADs形成的边界可能使基因暴露于错误的调控元件,并导致异常的基因表达,从而导致癌症的发生。如何从Hi-C数据中快速分析TADs?

OnTAD:快速定位+内部结构分析

最近,来自宾夕法尼亚州立大学的研究人员在《Genome Biology》杂志发表了其开发的一种快速定位并帮助阐明TADs复杂功能的新算法:OnTAD。

OnTAD以Hi-C接触矩阵作为输入,分两步调用TADs:1. 使用自适应局部最小搜索算法来寻找候选的TADs边界;2. 通过使用动态编程算法有选择地连接候选边界对来组装TADs。

TAD_1

TAD_2

OnTAD:发现TAD结构潜在生物学功能

目前的算法主要关注确定TADs的位置,对于TADs内部层级在基因调控中的生物学功能研究较少。使用OnTAD发现了有关TADs结构潜在生物学功能的新见解。

TAD_3

OnTAD分析结果显示存在两种在功能上截然不同的TAD类别:分层级的TADs和非分层级的TADs。与非分层级TADs相比,分层级的TADs边界具有更高的CTCF富集,更活跃的表观遗传状态和更高水平的基因表达。

TAD_4

我们还观察到TAD边界共享存在明显的不对称性,这支持了非对称loop挤压形成TADs的模型。

TAD_5

内部TAD中的活跃表观遗传状态比外部TAD中的丰富,subTAD表现出明显的表观遗传学特征。

这些结果表明OnTAD可以在高分辨率Hi-C数据中推断整个基因组中不同水平的染色质组织,有助于改进对染色质组织在基因调控中作用的研究。

可从https://github.com/anlin00007/OnTAD获得OnTAD。

参考文献
An L, Yang T, Yang J, et al. OnTAD: hierarchical domain structure reveals the divergence of activity among TADs and boundaries[J]. Genome Biology, 2019, 20(1): 1-16.
图片来源:均来自于参考文献,如有侵权请联系删除。

上一篇下一篇