2020-04-26 4377课程
本期课程回放:
课程PPT获取方式:
关注下方『国家基因库大数据平台』公众号,回复『课程3』
上期课程回顾:
干货 | \<4月专题第二期课程回顾>DNA甲基化生信分析
2020 CNGBdb系列公益课程开讲啦!
2020年4月24日4月专题
四节课带你玩转表观组学研究
<第3讲>上线
课程名称:RNA甲基化生信分析
讲师: 韩京华,尼奥基因组学研究院表观团队高级生信分析师。在国际知名期刊发表多篇研究论文,并获得4项软件著作权。
Q:四项限图每个象限代表什么意思?
A:四象限图展示的是鉴定出的peak的差异倍数(log2FC)和对应基因的表达量差异(log2FC)之间的关系。假设纵坐标是peak差异倍数,横坐标是peak对应基因的差异表达倍数,那么第一象限就表示:m6A修饰水平升高的差异peak所对应的的基因的表达量也升高。可以将既是显著差异peak,其对应的基因又是显著差异表达的这些peak用不同的颜色展示。
Q:motif是什么意思?
A:motif是一段序列组成具有一定特征的功能序列。例如:转录因子会识别基因组上特定的序列并结合上去,那么这段DNA序列就称为motif。不同的转录因子识别的motif不同。对于m6A来说,m6A修饰会倾向于发生在RRACH (R=G/A; H=A/C/U)这样的序列上,那么RRACH这个序列就称为motif。
Q:测m6A的同时,也能进行RNA测序,对吗?
A:是的,m6A-seq包含input和IP两个文库,input文库实际上相当于RNA-seq建库。许多文章就会利用input文库来计算基因的表达量。
Q:请问这里的peak和ChIP-Seq分析有什么区别?
A:对于peak的鉴定:m6A-seq有专门的软件,如exomePeak,MeTPeak等,但也有文章会用MACS2(针对DNA IP类数据鉴定peak开发的软件)来鉴定peak。
对于peak的注释:ChIP-seq数据一般不用区分正负链,m6A-seq数据需要区分正负链。
Q:能再解释下关于区分正负链的原因吗,以及不区分的话会有什么后果?
A:基因组有正负两条链,有的转录本由正链转录而来,有的转录本由负链转录而来。一般的软件,如果不指定需要区分正负链的参数,软件就会默认用两条链或者用正链的信息来分析数据,这样就会导致分析结果不准确。例如:一个peak是负链上的,且这个peak对应的位置的正链正好有一个基因,在对peak进行注释时没有区分正负链,那么可能就会将正链上的基因认为是该peak关联的基因。
Q:微量m6A,需要的组织量大概是多少?
A:不同组织需要的量不一样。一般需要提取的总RNA量在10-20ug左右。
Q:是否可以明确是某个具体基因转录本的m6A修饰引起的表型变化?
A:目前的m6A-seq测序由于建库时打断片段较短,将m6A修饰关联到具体的转录本是有困难的,所以建议将m6A修饰关联到基因水平而不是转录本水平。所以仅利用m6A-seq测序数据“明确是某个具体基因转录本的m6A修饰引起的表型变化”比较困难。
Q:测m6A时,每组需要最少几个重复样本?
A:目前已发表的文章使用的重复并不多(多于3重复个的很少),但有文章指出,重复样本少会导致假阳性率偏高,所以目前没有具体应该用几个重复样本的定论。
参考文献:Alexa B. R. Mcintyre et al. Limits in the detection of m6A changes using MeRip/m6A-seq. Scientific Reports 10, 6590 (2020).
Q:老师,还想问下关于m6A修饰与基因表达有什么关系,一般活跃转录的基因,相应的m6A修饰水平就高吗?
A:m6A修饰无法影响转录,因为m6A是转录后的修饰。这里说的基因表达如果指的是利用RNA-Seq鉴定得到的基因表达量:m6A在细胞核内会影响mRNA的可变剪接,在细胞质中(即经过加工的mRNA出核以后)会影响mRNA的降解,所以m6A对表达的影响是很复杂的,不能一概而论。 同时,m6A也会影响mRNA的翻译。
Q:m6A的也是用亚硫酸盐处理吗?
A:m6A-seq建库不需要用到重亚硫酸盐,而是利用m6A特异的抗体将包含m6A修饰的RNA片段富集,然后针对这些片段进行测序(IP文库),同时利用input文库来矫正不同样本表达量差异。最后可以通过鉴定reads的富集(peak)来鉴定m6A修饰的位置。
审核:韩京华
图片来源:千聊直播平台页面