您现在的位置是:课程
生物信息学入门课:学习生信你需要了解的统计学 第1讲
2023-12-05 20:00课程 人已围观
个人简介
大家好,我是孟浩巍。很高兴能够在腾讯课堂与大家见面!
我目前就读与北京大学生命科学学院,正在攻读博士学位,在5年学习生物信息学分析的过程中积累了大量经验,很愿意分享给大家。
之前在某乎平台,我创建了一系列在线课程,先后有6000人参与并获得全部好评。
此外,我还创建了名为【生信坑】的生物信息学问答网站,欢迎大家有问题到网站上进行交流!我们在【生信坑】也会每周推送生信领域最信,最热的文章,并进行简要导读。
课程介绍
学习生物信息学,总也绕不过去的便是统计学的学习了。
很多时候,生物信息学数据分析的好坏,很大程度上由一个人的统计思维,或者统计数据分析能力决定。拥有良好统计思维与统计技能的你,往往会成为课题或者项目推动的核心力量。但是无论是大学还是研究生的教学过程中,与生物信息学相关的专业往往会淡化数学尤其是统计的学习与统计思维的培养,给我们以后的工作和深造带来了很多困扰。
说回统计学本身,她其实是一门偏应用的数学学科,属于数学里相对来说比较容易的部分,所以大家一定要克服畏难情绪,在学习统计的时候一定要先告诉自己:统计学是一门非常容易学习的科目。
我之前写过一篇关于生物信息学相关的统计学入门路线的文章,原文相对较长,我在这里给大家简单概括。我认为生物信息学相关的统计主要是分成3个部分:1是常见的一元统计,包含最基础的概念及常用检验,简单的线性回归,方差分析等等;2是多元统计部分,理论推导比较麻烦,在生信里主要是偏应用,大家熟悉的主成分分析(PCA),奇异值分解(SVD),逻辑斯蒂回归等都是属于这个部分的;3是一些常用的其他统计技能,比如与统计学习,机器学习相关的支持向量机(SVM),决策树,回归树,常见降维方法,概率图模型(最常见的如隐马模型),以及一些生信里常用软件内包含的统计学等等。
那么我的计划是通过3个相对独立的课程,来与大家共同探讨统计学中一些比较常见的概念。本次,主要是讨论一元统计的部分。
在本次课程中,我们将会介绍大家数据分析时最常见的统计学概念与问题,并通过实例与R语言的实战操作帮助大家理解与掌握相关的知识,更多的内容,可以收看我们的第1节课程说明部分。
最后,一定要说明的是,统计学习一定要注重统计思维的培养,养成用统计学去思考问题的方式,不过这种培养不是一朝一夕能够练成的,希望我们在学习的路上相互陪伴。
课程主要目录及内容
统计学基础知识:
大家好,我是孟浩巍。很高兴能够在腾讯课堂与大家见面!
我目前就读与北京大学生命科学学院,正在攻读博士学位,在5年学习生物信息学分析的过程中积累了大量经验,很愿意分享给大家。
之前在某乎平台,我创建了一系列在线课程,先后有6000人参与并获得全部好评。
此外,我还创建了名为【生信坑】的生物信息学问答网站,欢迎大家有问题到网站上进行交流!我们在【生信坑】也会每周推送生信领域最信,最热的文章,并进行简要导读。
课程介绍
学习生物信息学,总也绕不过去的便是统计学的学习了。
很多时候,生物信息学数据分析的好坏,很大程度上由一个人的统计思维,或者统计数据分析能力决定。拥有良好统计思维与统计技能的你,往往会成为课题或者项目推动的核心力量。但是无论是大学还是研究生的教学过程中,与生物信息学相关的专业往往会淡化数学尤其是统计的学习与统计思维的培养,给我们以后的工作和深造带来了很多困扰。
说回统计学本身,她其实是一门偏应用的数学学科,属于数学里相对来说比较容易的部分,所以大家一定要克服畏难情绪,在学习统计的时候一定要先告诉自己:统计学是一门非常容易学习的科目。
我之前写过一篇关于生物信息学相关的统计学入门路线的文章,原文相对较长,我在这里给大家简单概括。我认为生物信息学相关的统计主要是分成3个部分:1是常见的一元统计,包含最基础的概念及常用检验,简单的线性回归,方差分析等等;2是多元统计部分,理论推导比较麻烦,在生信里主要是偏应用,大家熟悉的主成分分析(PCA),奇异值分解(SVD),逻辑斯蒂回归等都是属于这个部分的;3是一些常用的其他统计技能,比如与统计学习,机器学习相关的支持向量机(SVM),决策树,回归树,常见降维方法,概率图模型(最常见的如隐马模型),以及一些生信里常用软件内包含的统计学等等。
那么我的计划是通过3个相对独立的课程,来与大家共同探讨统计学中一些比较常见的概念。本次,主要是讨论一元统计的部分。
在本次课程中,我们将会介绍大家数据分析时最常见的统计学概念与问题,并通过实例与R语言的实战操作帮助大家理解与掌握相关的知识,更多的内容,可以收看我们的第1节课程说明部分。
最后,一定要说明的是,统计学习一定要注重统计思维的培养,养成用统计学去思考问题的方式,不过这种培养不是一朝一夕能够练成的,希望我们在学习的路上相互陪伴。
课程主要目录及内容
统计学基础知识:
- 什么是概率?
- 什么是随机变量?
- 概率密度函数及累积分布函数;
- boxplot与histogram;
- 最重要的若干分布(离散+连续);
- 二项分布;
- 泊松分布;
- 负二项分布;
- 几何分布;
- 超几何分布;
- 指数分布;
- 正态分布;
- Gamma分布;
- 什么是假设检验?
- 女士品茶与Pearson拟合优度检验;
- P value是什么意思?怎么计算?
- 什么是第1类错误,什么是第2类错误?
- P value使用常见错误有哪些?
- 什么是统计检验的功效?
- t检验专题;
- 为什么要用t检验?
- t检验的前提是什么?
- 如何进行配对t检验?
- 列联表检验问题
- Fisher exact test和卡方检验;
- 从2×2到m×n的推广;
- 多重检验的矫正问题;
- 什么是P value什么是Q Value?
- 方差分析;
- 简单的回归分析;
- 什么时候要用Pearson相关系数,什么时候用Spearman相关系数?
- 什么是决定系数?
- 回归分析中的P Value到底是怎么回事?
- 比较重要的非参检验方法;
下一篇:高级汽修诊断师强化特训班