建议看这篇博客:https://www.jianshu.com/p/b570b1ba92bb。需要指出的是概率密度函数是针对连续性随机变量而言的。
第十九集-----二十二集 二项分布这几节主要讲了二项分布的例子,便于理解。二项分布进阶的博客(个人觉得整理的已经很好了):https://blog.csdn.net/Michael_R_Chang/article/details/39188321。需注意的是二项分布针对的是离散型随机变量。
第二十三集:期望随机变量的期望值其实是总体的均值,但有时由于总体样本无限多,用均值计算方法很难计算,故提出期望E(x)计算均值的方法.其思想是用频率作为权重计算出所有结果的加权平均值。
第二十四集:二项分布的期望值对于二项分布的期望计算如图所示,这节课有详细推导过程,在博客中就不进行详细写了,把这个结果记住就好了。
第二十五、六集:泊松过程泊松分布是来自于二项分布。具体参见这个博客生动又好理解的例子。在使用泊松分布前,我们应该知道它是用来求取某个时间段内发生事情x的概率有多大且其是离散分布。具体推导可以再次学习了解这章内容。
第二十七集 大数定律大数定律描述了随机现象最根本的一个性质:平均结果的稳定性。
大数定律告诉我们:对于独立同分布的随机序列,只要总体均值(随机变量期望)存在,则随着样本数的增加,样本均值会收敛到总体均值。注意样本数的足够性,概率是频率的一个极限值,这样可以避免赌徒谬误。(赌徒谬误的解释)
第二十八--三十四集 正态分布二项分布,泊松分布都是离散分布,而正态分布是连续分布。
二项分布和泊松分布都可以转化为正态分布。泊松分布是
,而正态分布是为无穷大。下图是正态分布的概率密度函数图和表达式,
还有就是计算时使用的一些经验法则,具体说:与均值相差一个标准差概率是68%, 两个标准差概率是95%,三个标准差概率是99.7%。当然具体计算也可以查阅正态分布表。
第三十五集 中心极限定律该定律是说随着样本n越来越大,这n个样本的m个均值会趋于正态分布。与大数定律的区别在于:大数定律描述的样本均值趋于总体均值,而中心极限定律描述的是样本均值的分布。
第三十六、七集 样本均值的抽样分布样本均值抽样分布是所有样本均值抽样形成的分布。其中偏度与峰度是描述一个分布有多像正态分布的物理量。其中正偏度表示数据正向的多,负偏度表示数据负向的多。峰度反映了锋部的尖度。
第三十八、九集 均值标准(误)差样本均值抽样分布是所有样本均值抽样形成的分布。均值标准差是样本均值抽样分布的标准差,其和总体标准差的关系为:
第四十一、二集 伯努利分布(一种特殊的二项分布)二项分布是n重伯努利实验成功次数的分布。伯努利分布又叫两点分布或者0-1分布。(这个很好理解)