也即是说当n足够大时,经验分布函数是总体分布函数F(x)的一个良好的近似。格里纹科定理表明,当样本数足够多时,用样本估计总体是合理的,这即是数理统计的基础。
4,经验分布函数图形
求经验分布函数Fn(x)在一点x处的值,只要求出随机变量X的n个观测值(x1,x2,..,xn)中小于或等于x的个数,再除以观测次数n即可。由此可见,经验分布函数Fn(x)就是在n次重复独立实验中事件{X<=x}出现的频率。
经验分布函数Fn(x)的图形是一条呈跳跃上升的。
如果样本观测值(x1,x2,..,xn)中没有重复的数值,则每一跳跃为1/n。图中圆滑曲线是总体X的理论分布函数F(x)的图形。若把经验分布函数的图形连成折线,那么它实际就是累积频率直方图,这和概率分布函数的性质是一致的。
三,抽样分布统计量的分布称为抽样分布,在使用统计量进行统计推断时,常需要直到它的分布。当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一般来说是困难的。
统计量的三大分布是指卡方分布(χ2分布)、t分布和F分布,是来自正态总体的三个常用的抽样分布,下文会详细介绍,此处略。
1,关于样本均值和方差的重要结论
设总体X(不管服从什么分布,只要均值和方差村子啊)的均值为μ,方差为σ; X1,X2,...,Xn是子来自总体X的一个样本,和S2分别是样本均值和样本方差,
则有E()=μ,D()=σ2/n,E(S2)=σ2。
2,正态总体的样本均值与样本方差的分布
定理一:设 X1,X2,...,Xn是来自正态总体N(μ,σ2)的样本,那么是样本均值,则有
设统计量 Z,n为样本容量,μ为样本均值,S为样本标准差,
那么Z服从标准正态分布,即Z~N(0,1),这就是在假设检验中用到的Z检验统计量。
定理二:设 X1,X2,...,Xn是来自正态总体N(μ,σ2)的样本,和S2分别是样本均值和样本方差,则有
设卡方统计量χ2,那么该统计量服从卡方分布,即χ2~χ2(n-1),这就是假设检验中经常用到得卡方检验统计量。
定理三:设 X1,X2,...,Xn是来自正态总体N(μ,σ2)的样本,和S2分别是样本均值和样本方差,则有