集中量数
统计资料经过分组归类的初步整理和列表绘图之后,已经能够简化繁冗的数量而窥其分布的大概面貌。但如果要对数据资料进行深入的了解和研究,仅有图表是不够的,还必须计算出描述数据分布状况的特征量,包括集中量数、差异量数和相关量数等。本节的主要内容是介绍有关集中量数的计算。
在将数据资料进行初步整理所编制的次数分布表或图上,我们可以看出各组数据分布的次数虽然各有不同,但大部分数据都趋向于某点,这种向某点集中的现象,称为集中趋势。而代表数据的集中趋势的统计量被称为集中量数。例如,如果要分析两个班某个学科的考试分数,我们很难做到将两个班学生的分数加以一一对应的比较,因为学生的考试分数大多是不相同的,而且两个班的学生人数也不一定相等。在这种情况下,可以利用两班的平均分数进行比较,因为大多数的学生分数都分布在平均分数的附近,这里的平均分数就代表了某班某科的学生成绩的集中趋势。
常用的集中量数有算术平均数、中数、众数和几何平均数。
一.算术平均数
(一)算术平均数的概念与性质
1.概念
算术平均数通常称为平均数、均值或均数。它是各变量值的总和除以变量总次数所得之商。因为“平均数”一词的英文是Mean,所以一般用字母M来表示。如果想表明平均数M是由哪个变量计算得来的(或称某个变量的平均值),可以在该变量字母上面加一杠“—”来表示。如:表示变量X的平均数,表示变量Y的平均数。
算术平均数是统计学中最常用的一种集中量数。算术平均数的基本运算公式为
简写为(公式10—1)
式中:∑为希腊字母(读做Sigma,西格玛),为算术平均数,N为总次数,为各变量值。
例1,某小组11个学生的英语测验成绩分别为76,81,69,90,94,83,89,65,77,83,91。其算术平均数为:
M=≈81.63
2.性质
算术平均数有以下三个性质:
A.观察值的总和等于算术平均数的n倍。即
证明:
因为
所以
B.观察值与算术平均数之差(离差)的代数和为0。即
证明:
=
=
C.如对每个变量值加或减一个常数C,则平均数也增多或减少同一常数C。
证明:因为
所以
同理可证减去一个常数。
D.如对每个变量值乘或除一个常数C,则平均数也相应地扩大或缩小同样的倍数。
证明:
同理可证除以一个常数。
(二)算术平均数的计算方法
1.对未归类的原始数据求算术平均数的方法
当一组数据没有进行归类整理并且数据个数不多时,我们可以直接利用(公式10—1)计算出该组数据的算术平均数。如上面的例子,在此不再举例。
2.对利用次数分布表加以归类的数据求算术平均数的方法
(1)用简单次数分布表归类的数据求算术平均数的方法
当我们面对的是一组个数较少且相同数据出现次数较多的原始数据时,可先将这组数据编制成简单的次数分布表,然后按照下面的公式来求其算术平均数:
(公式10—2)
式中:为某个观测值,为该观测值的次数,N为观测值的个数之和(等于),为所求的某批数据的算术平均数。