样本方差的公式

我们用的沈恒范的教材,第二版是n,第三版是n-1,没有给出修改的原因。在第二版中,n-1的公式叫做修正样本方差,修正样本方差是总体方差的无偏估计值,因此在参数估计中有重要的应用。查了一下别的书,有的把n的公式叫做未修正样本方差,下面这个解释非常精彩,来自于hanh的blog

自由度(degree of freedom,df)——当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数称为该统计量的自由度。

在估计总体的平均数时,样本中的n个数全部加起来,其中任何一个数都和其他数据相独立,从其中抽出任何一个数都不影响其他数据(这也是随机抽样所要求的),所以自由度就是 n。

总体的方差是由各数据与总体平均数的差值求出来的,因此必须将总体平均数 固定后才可以求总体的方差。但是由于总体平均数被固定,它就不能独立自由变化,方差受到总体平均数的限制,少了一个自由变化的机会,因此, 使用样本方差来估计总体的方差时,分母的n必须改为(n-1)才不会低估总体的方差,这里(n-1)是样本的自由度,又叫总体方差的无偏估计值。

看了半天,如果作为统计应用,我认为n-1更能反映全体学生这个”总体”的变化,而n则更适用于样本。教务处的应用应该是属于样本的统计,而非总体的参数估计,所以我认为用n更为妥当。如果想要通过一个班的学生成绩方差来估计全校的方差,则使用自由度n-1的公式更为准确,可以证明,n-1的方差是总体方差的无偏估计量,而且是一致估计量。

以上。
准备睡觉的老狼

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注