<2020第二期课程回顾>DNA甲基化生信分析

2020-04-17 4254课程

本期课程回放:

上期课程回顾:\<2020第一期课程回顾>表观组学概述

2020 CNGBdb系列公益课程开讲啦!
2020年4月16日4月专题 四节课带你玩转表观组学研究 <第2讲>上线
课程名称:DNA甲基化生信分析

讲师: 韩京华,尼奥基因组学研究院表观团队高级生信分析师。在国际知名期刊发表多篇研究论文,并获得4项软件著作权。

课程概要

  1. DNA甲基化技术概述
  2. DNA甲基化样本制备
  3. DNA甲基化案例简析
  4. DNA甲基化生信分析讲解

现场Q&A

  1. Q:请问现在scWGBS基因组覆盖率和通量情况(一次能做多少单细胞)如何?
    A:根据建库方法、测序数据量的不同,覆盖的C位点数也会有区别。我们团队目前采用的建库方法,一个细胞建库测序覆盖度在10%-20%。单个细胞提取出来的基因组可能不完整,如果取几个同一类型的单细胞,分别建库,最后将数据pool在一起分析,可以达到更高的覆盖度。
    另外,如果不是关心单个细胞的甲基化状态,而是因为样品比较少,可以用几十个细胞,采用微量DNA建库方法来建库,这样比对率、覆盖度都会好很多。
    至于通量情况,scWGBS与10x Genomics不同,scWGBS每个细胞都是单独建库的,多少个细胞都可以做,只是样本很多的话需要更多的时间。

  2. Q:请问过度出现和duplication有什么区别呢?
    A:通常所说的duplication指的是PCR引入的read1和read2(对于双端测序来说)完全相同的reads,过度出现的reads包括了所有完全相同的reads,不管是由酶切导致的还是由PCR引入的。对于RRBS/dRRBS来说,由于大部分都是酶切导致的,且无法区分到底是酶切引入的还是PCR引入的,所以RRBS/dRRBS是不需要去duplication的。

  3. Q:硬骨鱼的甲基化修饰情况如何?
    A:硬骨鱼中的斑马鱼甲基化绝大部分发生在CG上[1],CHG和CHH甲基化水平则很低(<3.6%)[2]。
    [1] Jorke H. Kamstra et al. Zebrafish as a model to study the role of DNA methylationin environmental toxicology. Environ Sci Pollut Res (2015). 22:16262–16276.
    [2] Elodie, F., Ducos, B., Stockwell, P.A., Morison, I.M., Chatterjee, A., Silvestre,Fréé., DNA methylation and gene expression alterations in zebrafish early-life stages exposed to the antibacterial agent triclosan, Environmental Pollution (2018), doi: https://doi.org/10.1016/j.envpol.2018.10.004.

  4. Q:怎么做PCA呢?
    A:可以把每个样本的甲基化图谱(每个C位点的甲基化率)合并起来,生成如下格式的文件:
    image.png

将合并后的文件读入R,并将行列进行转置(R函数t()),转置后的文件可作为PCA分析软件的输入。PCA分析R包/函数包括prcomp、princomp 、Psych、gmodels等,这些包/软件可以进行主成分分析,可以结合ggplot2等作图包进行可视化。
5. Q:为什么read 2比对率较低?
A:双端测序的数据一般都是以pair-end的模式来比对的,比对结果的报告会将双端都比对上、只有read1比对上、只有read2比对上三种情况分别报告。根据我们的经验,大部分的read都是双端均比对上的,只有read1比对上和只有read2比对上这两种情况的比对率也不会差很多。
6. Q:怎么把差异甲基化位点提现在circos上?
A:可以用circos展示全基因组各个区域的甲基化水平,或者甲基化C位点的密度。可以将全基因组划分成长度相同的bin,计算每个bin的平均甲基化水平,然后以这个平均甲基化水平文件作为输入,利用circos软件进行作图。circos需要一个配置文件,在配置文件中可以设置需要作图的类型(直方图、热图等)以及其他参数,设置好configure文件后,直接画图即可。

审核:韩京华
图片来源:千聊直播平台页面

上一篇下一篇