样本方差的公式 – 老狼的窝-wolfccb

我们用的沈恒范的教材，第二版是n，第三版是n-1，没有给出修改的原因。在第二版中，n-1的公式叫做修正样本方差，修正样本方差是总体方差的无偏估计值，因此在参数估计中有重要的应用。查了一下别的书，有的把n的公式叫做未修正样本方差，下面这个解释非常精彩，来自于hanh的blog：

自由度（degree of freedom，df）——当以样本的统计量来估计总体的参数时，样本中独立或能自由变化的数据的个数称为该统计量的自由度。

在估计总体的平均数时，样本中的n个数全部加起来，其中任何一个数都和其他数据相独立，从其中抽出任何一个数都不影响其他数据（这也是随机抽样所要求的），所以自由度就是 n。

总体的方差是由各数据与总体平均数的差值求出来的，因此必须将总体平均数固定后才可以求总体的方差。但是由于总体平均数被固定，它就不能独立自由变化，方差受到总体平均数的限制，少了一个自由变化的机会，因此，使用样本方差来估计总体的方差时，分母的n必须改为(n-1)才不会低估总体的方差，这里(n-1)是样本的自由度，又叫总体方差的无偏估计值。

看了半天，如果作为统计应用，我认为n-1更能反映全体学生这个”总体”的变化，而n则更适用于样本。教务处的应用应该是属于样本的统计，而非总体的参数估计，所以我认为用n更为妥当。如果想要通过一个班的学生成绩方差来估计全校的方差，则使用自由度n-1的公式更为准确，可以证明，n-1的方差是总体方差的无偏估计量，而且是一致估计量。