标准差和方差是一对非常重要但常被人忽视的统计学概念,它们能够描述数据集中的变异情况。如果我们仅仅认为某个数据集的平均数较高,就认为这个数据集的值都比较大,恐怕就被统计学家笑话了。毕竟,平均数高不代表数据分布就密集,极差小不代表数据比较接近。
方差是最常用的描述数据变异情况的统计量,它度量的是各个数值与所有数值平均数之差的平方值的平均数。方差越大,意味着数据值越分散,越不集中,反之则越集中。标准差是方差的平方根,一般作为变异系数的参考标准,它越小越好,因为越小说明各个数据点离平均值越近。
例如,某班学生的语文成绩分别是90、85、80、70、60分,计算这些分数的方差和标准差可以得到:
方差 = ((90-77)^2 (85-77)^2 (80-77)^2 (70-77)^2 (60-77)^2) ÷ 5 = 144.4
标准差 =方差的算术平方根 = 12.01