您现在的位置是:课程

高级生信系列课程:转录组数据分析

2023-12-05 20:00课程 人已围观

个人简介
大家好,我是孟浩巍。很高兴能够在腾讯课堂与大家见面!


我目前就读与北京大学生命科学学院,正在攻读博士学位,在多年学习生物信息学分析的过程中积累了大量经验,很愿意分享给大家。
之前在某乎平台,我创建了一系列在线课程,先后有上万人参与并获得全部好评。

此外,我还创建了名为【生信坑】的生物信息学问答网站,欢迎大家有问题到网站上进行交流!我们在【生信坑】也会每周推送生信领域最信,最热的文章,并进行简要导读。(可以百度搜索【生信坑】)


课程介绍
转录组(transcriptome)是指细胞内所有转录产物的集合,包括mRNA、rRNA、tRNA及ncRNA,狭义上的转录组一般指细胞内mRNA的集合。转录组测序数据是指对生物转录组进行高通量测序后得到的数据,简单来说转录组数据中包含了大量的基因表达情况的信息。而通常情况下,我们都认为基因表达量的变化极有可能引起相应蛋白质水平的变化,从而影响整个生物学进程。因此,目前在生物学、医学研究中,科研人员非常喜欢通过对比不同条件下转录组数据的差异基因,来获获得基因与条件的关联关系,最终帮助研究人员推断其中的因果关系。

虽然关于转录组测序数据分析的课程已经非常多,甚至有非常多的质量上乘的免费课程,但是这些课程绝大多数是从实战的角度出发,提供一套作者认为合理的数据处理流程,而忽略或者是很少提及背后的原理。他们之中鲜有能够从数据质控,比对算法,统计原理,单样本多样本比较差异等方面比较全面介绍转录组数据分析;同时还能够将不同软件和流程放在一起比较实战操作的。也基于此,我们推出了本次的课程——“高级生信系列课程:转录组数据分析”。

本次课程是“高级生信系列课程”的第一堂课。课程将比较详细和深入地介绍转录组数据的实验原理,数据质控原理,测序结果比对算法,差异表达分析的统计学原理,并结合已发表的高分文章的真实数据,进行实战操作。同时,针对复杂的多样本问题,将介绍一些常用的分析思路,如WGCNA等。在让大家能够上手操作的同时,还能深入理解数据背后选择软件和使用某一特定流程的理由。

相信,通过本次课程的学习,你一定能有所收获,为日后更复杂的生物信息学数据分析工作打下坚实的基础。

本次课程会带着大家对真实的数据进行分析,并把全部代码及可视化绘图结果分享给大家!

课程大纲

第1部分 RNA Seq的基础知识
1. RNA-Seq的生物学基础
2. RNA-Seq的发展历史
3. RNA-Seq及常用测序技术
    - Illumina
    - PacBio
    - Nanopore
    - MGI2500(华大智造)
4. RNA-Seq的常用建库流程
    - Poly A + 方式
    - rRNA - 方式
    - 链特异性 方式
5. RNA-Seq的常用质控指标
    - 测序质量
    - RIN
    - 降解曲线
    - 分布比例
6. RNA-Seq数据质控流程推荐
7. RNA-Seq分析流程概览

第2部分 RNA-Seq的mapping
1. RNA-Seq与WGS的mapping异同
2. Tophat2和Hisat2
3. STAR
4. Tophat2, Hisat2, STAR的比对算法 (*算法)

第3部分 RNA-Seq的定量及标准化
1. 几种常用的指标
    - Count
    - TMM
    - CPM     
    - FPKM
    - RPKM
    - TPM
    - RSEM
2. TPM与FPKM的比较
3. RSEM的原理

第4部分 寻找差异表达基因
0. RNA-Seq差异统计检验的基本假设
1. 方便快捷:cuffdiff2的使用与统计学原理
2. 基于count:edgeR的使用与统计学原理
3. 基于count:DESeq2的使用与统计学原理
4. 基于count:limma-voom的使用与统计学原理
4. 特殊样本RNA-Seq差异表达基因的寻找
    - 使用ERCC control进行校正
    - 使用house keeping gene进行校正

第5部分 RNA-Seq的注释分析
1. GO的原理及实现(David网站 + R语言)
2. GSEA的原理及实现(R语言)
3. KEGG的原理及实现(R语言)
4. 非模式生物的富集分析(R语言)

第6部分 多样本RNA-Seq分析
1. WGCNA
2. 多样本下差异表达的分析
3. 常见的多样本方法
    - PCA
    - 聚类
    - tSNE

* 讲授顺序以实际课程为准
-->

站点信息

  • 文章统计篇文章