您现在的位置是:课程
高级生信系列课程:转录组数据分析
2023-12-05 20:00课程 人已围观
个人简介
大家好,我是孟浩巍。很高兴能够在腾讯课堂与大家见面!
我目前就读与北京大学生命科学学院,正在攻读博士学位,在多年学习生物信息学分析的过程中积累了大量经验,很愿意分享给大家。
之前在某乎平台,我创建了一系列在线课程,先后有上万人参与并获得全部好评。
此外,我还创建了名为【生信坑】的生物信息学问答网站,欢迎大家有问题到网站上进行交流!我们在【生信坑】也会每周推送生信领域最信,最热的文章,并进行简要导读。(可以百度搜索【生信坑】)
课程介绍
转录组(transcriptome)是指细胞内所有转录产物的集合,包括mRNA、rRNA、tRNA及ncRNA,狭义上的转录组一般指细胞内mRNA的集合。转录组测序数据是指对生物转录组进行高通量测序后得到的数据,简单来说转录组数据中包含了大量的基因表达情况的信息。而通常情况下,我们都认为基因表达量的变化极有可能引起相应蛋白质水平的变化,从而影响整个生物学进程。因此,目前在生物学、医学研究中,科研人员非常喜欢通过对比不同条件下转录组数据的差异基因,来获获得基因与条件的关联关系,最终帮助研究人员推断其中的因果关系。
虽然关于转录组测序数据分析的课程已经非常多,甚至有非常多的质量上乘的免费课程,但是这些课程绝大多数是从实战的角度出发,提供一套作者认为合理的数据处理流程,而忽略或者是很少提及背后的原理。他们之中鲜有能够从数据质控,比对算法,统计原理,单样本多样本比较差异等方面比较全面介绍转录组数据分析;同时还能够将不同软件和流程放在一起比较实战操作的。也基于此,我们推出了本次的课程——“高级生信系列课程:转录组数据分析”。
本次课程是“高级生信系列课程”的第一堂课。课程将比较详细和深入地介绍转录组数据的实验原理,数据质控原理,测序结果比对算法,差异表达分析的统计学原理,并结合已发表的高分文章的真实数据,进行实战操作。同时,针对复杂的多样本问题,将介绍一些常用的分析思路,如WGCNA等。在让大家能够上手操作的同时,还能深入理解数据背后选择软件和使用某一特定流程的理由。
相信,通过本次课程的学习,你一定能有所收获,为日后更复杂的生物信息学数据分析工作打下坚实的基础。
本次课程会带着大家对真实的数据进行分析,并把全部代码及可视化绘图结果分享给大家!
课程大纲
第1部分 RNA Seq的基础知识
1. RNA-Seq的生物学基础
2. RNA-Seq的发展历史
3. RNA-Seq及常用测序技术
- Illumina
- PacBio
- Nanopore
- MGI2500(华大智造)
4. RNA-Seq的常用建库流程
- Poly A + 方式
- rRNA - 方式
- 链特异性 方式
5. RNA-Seq的常用质控指标
- 测序质量
- RIN
- 降解曲线
- 分布比例
6. RNA-Seq数据质控流程推荐
7. RNA-Seq分析流程概览
第2部分 RNA-Seq的mapping
1. RNA-Seq与WGS的mapping异同
2. Tophat2和Hisat2
3. STAR
4. Tophat2, Hisat2, STAR的比对算法 (*算法)
第3部分 RNA-Seq的定量及标准化
1. 几种常用的指标
- Count
- TMM
- CPM
- FPKM
- RPKM
- TPM
- RSEM
2. TPM与FPKM的比较
3. RSEM的原理
第4部分 寻找差异表达基因
0. RNA-Seq差异统计检验的基本假设
1. 方便快捷:cuffdiff2的使用与统计学原理
2. 基于count:edgeR的使用与统计学原理
3. 基于count:DESeq2的使用与统计学原理
4. 基于count:limma-voom的使用与统计学原理
4. 特殊样本RNA-Seq差异表达基因的寻找
- 使用ERCC control进行校正
- 使用house keeping gene进行校正
第5部分 RNA-Seq的注释分析
1. GO的原理及实现(David网站 + R语言)
2. GSEA的原理及实现(R语言)
3. KEGG的原理及实现(R语言)
4. 非模式生物的富集分析(R语言)
第6部分 多样本RNA-Seq分析
1. WGCNA
2. 多样本下差异表达的分析
3. 常见的多样本方法
- PCA
- 聚类
- tSNE
* 讲授顺序以实际课程为准
大家好,我是孟浩巍。很高兴能够在腾讯课堂与大家见面!
我目前就读与北京大学生命科学学院,正在攻读博士学位,在多年学习生物信息学分析的过程中积累了大量经验,很愿意分享给大家。
之前在某乎平台,我创建了一系列在线课程,先后有上万人参与并获得全部好评。
此外,我还创建了名为【生信坑】的生物信息学问答网站,欢迎大家有问题到网站上进行交流!我们在【生信坑】也会每周推送生信领域最信,最热的文章,并进行简要导读。(可以百度搜索【生信坑】)
课程介绍
转录组(transcriptome)是指细胞内所有转录产物的集合,包括mRNA、rRNA、tRNA及ncRNA,狭义上的转录组一般指细胞内mRNA的集合。转录组测序数据是指对生物转录组进行高通量测序后得到的数据,简单来说转录组数据中包含了大量的基因表达情况的信息。而通常情况下,我们都认为基因表达量的变化极有可能引起相应蛋白质水平的变化,从而影响整个生物学进程。因此,目前在生物学、医学研究中,科研人员非常喜欢通过对比不同条件下转录组数据的差异基因,来获获得基因与条件的关联关系,最终帮助研究人员推断其中的因果关系。
虽然关于转录组测序数据分析的课程已经非常多,甚至有非常多的质量上乘的免费课程,但是这些课程绝大多数是从实战的角度出发,提供一套作者认为合理的数据处理流程,而忽略或者是很少提及背后的原理。他们之中鲜有能够从数据质控,比对算法,统计原理,单样本多样本比较差异等方面比较全面介绍转录组数据分析;同时还能够将不同软件和流程放在一起比较实战操作的。也基于此,我们推出了本次的课程——“高级生信系列课程:转录组数据分析”。
本次课程是“高级生信系列课程”的第一堂课。课程将比较详细和深入地介绍转录组数据的实验原理,数据质控原理,测序结果比对算法,差异表达分析的统计学原理,并结合已发表的高分文章的真实数据,进行实战操作。同时,针对复杂的多样本问题,将介绍一些常用的分析思路,如WGCNA等。在让大家能够上手操作的同时,还能深入理解数据背后选择软件和使用某一特定流程的理由。
相信,通过本次课程的学习,你一定能有所收获,为日后更复杂的生物信息学数据分析工作打下坚实的基础。
本次课程会带着大家对真实的数据进行分析,并把全部代码及可视化绘图结果分享给大家!
课程大纲
第1部分 RNA Seq的基础知识
1. RNA-Seq的生物学基础
2. RNA-Seq的发展历史
3. RNA-Seq及常用测序技术
- Illumina
- PacBio
- Nanopore
- MGI2500(华大智造)
4. RNA-Seq的常用建库流程
- Poly A + 方式
- rRNA - 方式
- 链特异性 方式
5. RNA-Seq的常用质控指标
- 测序质量
- RIN
- 降解曲线
- 分布比例
6. RNA-Seq数据质控流程推荐
7. RNA-Seq分析流程概览
第2部分 RNA-Seq的mapping
1. RNA-Seq与WGS的mapping异同
2. Tophat2和Hisat2
3. STAR
4. Tophat2, Hisat2, STAR的比对算法 (*算法)
第3部分 RNA-Seq的定量及标准化
1. 几种常用的指标
- Count
- TMM
- CPM
- FPKM
- RPKM
- TPM
- RSEM
2. TPM与FPKM的比较
3. RSEM的原理
第4部分 寻找差异表达基因
0. RNA-Seq差异统计检验的基本假设
1. 方便快捷:cuffdiff2的使用与统计学原理
2. 基于count:edgeR的使用与统计学原理
3. 基于count:DESeq2的使用与统计学原理
4. 基于count:limma-voom的使用与统计学原理
4. 特殊样本RNA-Seq差异表达基因的寻找
- 使用ERCC control进行校正
- 使用house keeping gene进行校正
第5部分 RNA-Seq的注释分析
1. GO的原理及实现(David网站 + R语言)
2. GSEA的原理及实现(R语言)
3. KEGG的原理及实现(R语言)
4. 非模式生物的富集分析(R语言)
第6部分 多样本RNA-Seq分析
1. WGCNA
2. 多样本下差异表达的分析
3. 常见的多样本方法
- PCA
- 聚类
- tSNE
* 讲授顺序以实际课程为准