在样本估计总体均值时,我们需要知道估计的准确度,因此选定一个区间[a,b],目的是让这个区间包含总体均值,这个区间叫做置信区间。
对于这个区间有多大概率包含总体均值,这个概率称为置信水平。置信水平是根据实际问题自己确定的,一般设定为95%即两个标准差。
总之:置信区间是我们计算变量的存在范围,置信水平是我们对这个范围的可信程度。
置信区间计算方法:首先,计算样本均值
,样本均值标准差为。这几个公式的问题是事先我们并不知道总体的标准差。因此我们需要用估计值来代替。我们选择样本方差作为总体方差的估计,需注意是会跟随样本的变化而变化的,如图2所示。其次确定置信水平,最后查找z表格,计算置信区间。 第四十六集 小样本容量置信区间当样本数量小于30时,样本分布不再符合正态分布而是符合T分布。
T分布只有一个***度参数n,当n趋于无穷时,T分布变为标准正态分布,其实T分布只是正态分布的一种近似,是正态分布在小样本时的形态。计算置信区间的方法和正态分布类似,不同的是要查t分布表而不是z分布表。
第四十七、八集 假设检验假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。它是以假设为前提的。