据统计,前三季度,榆阳区实现全体居民人均可支配收入20612元,城镇常住居民人均可支配收入24662元,农村常住居民人均可支配收入10088元。大多数人一看到这个数据,第一反应就是:我又“被平均”了,统计数据果然水分很多!可是事实真的如此吗?下面就来了解一下统计中常用的平均数。

一、统计中常用平均数类型

平均指标按计算和确定的方法不同,分为算术平均数、调和平均数、几何平均数、众数和中位数。前三种平均数是根据总体各单位的标志值计算得到的平均值,称作数值平均数。众数和中位数是根据标志值在分配数列中的位置确定的,称为位置平均数。

(一)算术平均数

算术平均数也称均值,是最常见的平均指标。它的基本公式形式是总体标志总量除以总体单位数。在实际工作中,由于资料的不同,算术平均数有两种计算形式:即简单算术平均数和加权算术平均数。

1.简单算术平均数适用于未分组的统计资料,如果已知各单位标志值和总体单位数,可采用简单算术平均数方法计算。计算公式:

1.jpg

2.加权算术平均数适用于分组的统计资料,如果已知各组的变量值和变量值出现的次数,则可采用加权算术平均数计算。计算公式:

2.jpg

从公式可以看出,加权算术平均数的大小受两个因素的影响:其一是受变量值大小的影响。其二是各组次数占总次数比重的影响。在计算平均数时,由于出现次数多的标志值对平均数的形成影响大些,出现次数少的标志值对平均数的形成影响小些,因此就把次数称为权数。在分组数列的条件下,当各组标志值出现的次数或各组次数所占比重均相等时,权数就失去了权衡轻重的作用,这时用加权算术平均数计算的结果与用简单算术平均数计算的结果相同。

(二)调和平均数

调和平均数是总体各单位标志值倒数的算术平均数的倒数,又称为倒数平均数,有简单调和平均数和加权调和平均数。计算公式:

3.jpg

(三)几何平均数

几何平均数是n个变量值乘积的n次方根。在统计中,几何平均数常用于计算平均速度和平均比率。几何平均数也有简单平均和加权平均两种形式。计算公式:

4.jpg

(四)众数

众数是指总体中出现次数最多或频率最大的标志值。众数是一种位置平均数。在实际工作中往往可以代表现象的一般水平,如市场上某种商品大多数的成交价格,多数人的服装和鞋帽尺寸等,都是众数。但只有在总体单位数多且有明显的集中趋势时,才可计算众数。

(五)中位数

将总体各单位的标志值按大小顺序排列,处于中间位置的标志值就是中位数。由于中位数是位置平均数,不受极端值的影响,在总体标志值差异很大的情况下,中位数具有很强的代表性。

二、几种平均数之间的关系

(一)众数、中位数、平均数的特点和运用

1.众数的特点

众数不受极端值的影响且具有不唯一性,一般在数据分布偏斜程度较大时使用。

2.中位数的特点

中位数不受极端值的影响,一般在数据分布偏斜程度较大时使用。

3.平均数的特点

平均数较易受极端值影响,但是数学性质优良,一般用于数据对称分布或接近对称分布时。

(二)算术平均数、众数、中位数的数值关系

三者关系如下图:

5.jpg

三、我们为什么会觉得“被平均”?

从上面的介绍不难看出,统计中常用的平均数种类繁多,在不同情况下要使用不同的平均指标。目前,统计局公布的平均数据都是数值平均数,如平均工资、平均住房面积、人均GDP等是简单算术平均数,居民人均可支配收入是加权算术平均数,年均增长速度、年均发展速度等是几何平均数。而我们在实际生活中多用位置平均数来表示平均水平,大多数时候用众数来代替。

如文章开头举的例子,居民人均可支配收入采用加权算术平均方法来计算,由于居民收入是右偏分布,即高收入人群少,而中低收入的人较多,计算出来的均值就会大于众数,并且当右偏分布的偏态越严重时,均值和众数之间的差别就会越大,导致大多数人觉得自己“被平均”了。

国家统计局局长宁吉喆今年8月中提出“对于个别方面,有的领域存在的统计虚假的现象,虽然它是个别的、少数领域的,我们是实行零容忍,严查处的办法,部分地区先前虚报数据,但现在的统计数据总体而言是可信的,与国际上也是可比的。”所以,当你发现统计局公布的数据和你想象的不一样时,不妨多了解一下这个数据的计算方法,再作评价。