1、基尼系数。基尼系数的描述引自百度:
http://baike.baidu.com/view/186.htm
计算基尼系数使用洛伦兹曲线(见下图红色曲线)
通过大范围采样,可获得一财富排序表——按每个人的财富大小自左至右依次排列。即,排序表中任何一人都比左边相邻的人富有。
上图的横标:排序表中任何一人及左边所有人之和占总人数的百分比;纵标是:上述人群的财产之和占排序表总财产之和的百分比。图中的对角线AC(绿线)表示所有人财产相等(绝对平均);红绿线围成的面积代表了贫富差距,这一面积与三角形ABC的面积之比就是基尼系数。注意,此图纵横两轴采用了不同的比例尺。若比例尺相同,该图形应该是正方形,这不影响统计结果。
图中做另一对角线BD,其中EB段是“财富倒挂点”的轨迹,与红线相交于F,该点横标为X(下同),则F点即洛伦兹曲线的倒挂点。“倒挂”的含义是,X%的人群拥有(100-X)% 的财富。该图的中,X=60,不妨称为“四六倒挂”。
2、用“倒挂折线”粗略计算基尼系数。
图中,作折线AFC,以近似代替洛伦兹曲线。则三角形AFC与三角形ABC的面积之比即为基尼系数Y的近似值,
Y > 1-0.02*x (x=0,1,2....50) (1)
(1)式右端是用小学高年级算三角形、正方形面积的方法演绎而来,不赘述;其中不等号“>”的意义是:三角形AFC的面积总小于红绿线围成的面积,且“倒挂”越严重,其误差越大。依次计算四六、三七、二八倒挂的基尼系数分别是 0.2,0.4,0.6 。由曲线特征可以推断,四六倒挂的基尼系数0.2误差不大,而二八倒挂的实际基尼系数可能远不止0.6(见后)。
3、十个人的基尼系数
假设有代表性的10个人(也可以代表10个家庭或大范围中10%的采样人群平均值)的财产折合成人民币(单位为万元),从小到大依次排序的表格(见第一行)如下:
1 2 3 4 5 6 7 8 9 10
1 7.5 9.0 20 45 100 225 500 1100 2500 5500
2 7.5 16.5 36.5 81.5 181.5 406.5 906.5 2006 4500 10000
3 0.075 0.165 0.365 0.815 1.815 4.065 9.065 20.06 45 100%
第一行左边第一位财产有7.5万元。譬如某农家收入比较拮据,积攒多年建了新房,没有或有少量存款。从左到右一个比一个富裕,到第10位,就有5500万财产了。
第二行的第二个数据是第一行的第一、二人的财产相加;第三个数据是前一二三个人的财产相加,以此类推。所以,第10个数据是10个人的总财产,是一亿元(列表时忽略了后面较大数据的个位数,对统计结果影响不明显)。
第三行是把第二行的“万元”数用百分比表示,基数为10个人的总财产即一亿元。以下分析把第一行所属的第x个人看成是采样人群的百分比10*X%。例如第3位代表前30%的人口。这样就可以建立由排序表得到的人口百分比与这些人的财产总值百分比的函数关系,即前述的洛伦兹曲线。从第三行第八列可看出,这一组数据属典型的“二八倒挂”。
为了便于积分计算,将该曲线拟合成一指数函数式,其精度可用第三行数据验证:
y = 0.0336*exp(0.08*x)(%) -----(2)
注意(1)式的Y是基尼系数,介于(0-1)之间;(2)式的y是洛伦兹曲线的纵标,x、y的取值范围都是(0-100)。(2)式用指数函数拟合的缺点是y不能从0值开始。例如将x=0带入得:y=0.0336%,这对计算面积影响甚微。
积分时,被积函数是直线 y=x 与(2)式之差,积分上下限是(100-0)。将积分结果再除以三角形ABC面积(=5000),可得到此时的基尼系数:
Y = 1-{0.42(exp(8)-1)}/5000 = 0.75 (3)
这一组二八倒挂的数据的基尼系数竟达0.75,与(1)式的0.6相差很大!换一组数据也许有点出入,但估计误差不大。这意味着,如果承认“二八倒挂”,基尼系数决不是目前媒体公布的0.61 !