课程回放:
https://vzan.com/live/tvchat-8555973?v=0.10255432694318078
CNGBdb组学/数据库系列课程开讲啦!
2019年9月26日<第七讲>上线
课程名称:单细胞技术应用和研究思路
讲师:庄镇堃,参与癌症基因组、肿瘤免疫微环境,猴脑单细胞图谱等项目,搭建单细胞转录组生信分析流程,具有丰富的单细胞生信分析经验。
课程概要
单细胞 VS 传统检测:传统测序方法一次处理成千上万个细胞,得到的变异水平也是成千上万个细胞的平均后水平。而单细胞测序则把分析的清晰度提升到了单个细胞的水平。
单细胞检测可发现:细胞类型的异质性、新的细胞类型、发病机理、新的生物标志物、发育进程等。
如何用单细胞技术解决科学问题:
- 明确科学问题
- 挑选合适的实验技术方法,产出数据
- 生信分析
实验验证
各个组学的单细胞实验方法进展:scRNA-seq(转录组)、scATAC-seq(表观组)、蛋白组、CITE-seq (转录组& 蛋白组)、scRNAseq & scATACseq(转录组&表观组)
单细胞生信分析思路与新方法介绍:根据不同组学的数据类型,不同的科学问题,生信分析的方法多种多样,本次主要为大家介绍单细胞转录组的生信分析方法。
现场Q&A
- Q:drop out缺失是什么原因引起呢?
A:基因方面的drop out是由几个方面引起的,一个是RNA-seq取样具有时间局限性,在某一时间点,某些细胞本该正常表达的某些基因的表达可能正好处于较低的状态。二是不同的单细胞技术实验方法,其生化反应所用的试剂/原理不同,也会带来不同程度的随机drop out 率。可以理解为单细胞RNA-seq技术目前的系统误差;细胞方面的drop out,是某些实验方法会随机的丢失一些细胞类型,例如基于液滴的实验方法,液滴的大小会影响大细胞(巨噬细胞)的捕获。drop out缺失算是目前单细胞测序实验的技术短板。 - Q:您PPT中的两篇文献都是不同来源的单细胞放到一起分析,然后分析后再做拆分,如果把每个病人的细胞单独分析会和一起分析再做拆分的结论一致嘛?
A:目前的数据都会有一个问题:单个患者细胞数较少(几百到几千),不同细胞数量的数据集聚类的时候会由于细胞类型缺失导致数据变化的不同,这样做出来的解读会是每个患者都存在出入。
不同来源的单细胞放到一起分析时,为了消除个别患者样本的特异性,我们会考虑患者特异性的特征并且在分析前做去除,保留共性特征再进行分析。整体分析后我们还会对特异性特征进行单独分析(例如对不同癌症分期的患者进行分组)。 - Q:整合多组单细胞数据,批次效应的消除,消除的算法有不少,结果也不太一致,这个该怎么选择?遇到用monocle3和seurat两种整合数据结果不一致,也和和cellranger aggr的整合结果也不一致的情况。
A:消除批次效应的算法也是有很多种的,有很多现有软件还有一些自建分析流程,这些软件的效果是不大一样的。如果要深究哪个软件最好,需要根据项目的具体情况,选择不同批次的细胞类型标准数据集进行验证,应该是有挺多文章做这样的测试的,感兴趣的可以去搜一下。cellranger aggr的结果是比较原始的。目前用的多、效果比较好的应该是seurat3。 - Q:每个细胞构建一个表达网络的方法,是现在常用的方法吗?看到的大部分文章好像都是传统差异表达的。
A:还不是一个常用的方法,这是今年才发表的方法。目前我们联合上海生化所正在对该方法进行优化,利用大型数据集进行测试。目前已发表的文章测试的数据集较少(几百个细胞),单个细胞的network需要考虑drop out及如何消除批次差。从单细胞network发布到广泛应用应该还有一段路要走。
审核:庄镇堃