作者:罗林霞
摘要:研究居民消费价格指数的影响因素,建立与居民消费价格指数相关的多元线性回归模型,借助统计软件SPSS对数据作线性回归分析,对模型进行自变量的筛选、多重共线性、异方差性及自相关性的检验。最终检验出模型存在异方差性,利用加权最小二乘估计消除异方差性,确立最终的回归方程,各自变量对居民消费价格指数都是正影响,其中食品的影响是最显著的,其次是衣着和交通通讯,显著性最小的是医疗保健及个人用品。
关键词:居民消费价格指数;多元线性回归;逐步回归法;DW检验;共线性诊断;异方差检验;加权最小二乘估计
引言:CPI反应一定时期内居民所消费商品及服务项目的价格水平变动趋势和变动程度。居民消费价格水平的变动率在一定程度上反映了通货膨胀(或紧缩)的程度。通俗的讲,CPI就是市场上的货物价格增长百分比。一般市场经济国家认为居民消费价格指数增长率在2%-3%属于可接受范围内,当然还要看其他数据,CPI过高始终不是好事。因此,对CPI的影响因素的研究十分重要。 一、因变量与自变量的提出
选取的数据是2013年《中国统计年鉴》里面的我国31个省、市、自治区的相关数据,y为居民消费价格指数,x1为食品,x2为烟酒及用品,x3为衣着,x4为家庭设备用品及维修服务,x5为医疗保健及个人用品,x6为交通通信,x7为教育文化娱乐及用品,x8为居住。 二、模型初步建立与检验
利用SPSS软件对数据作线性回归分析得:
根据表一,F=52.5,P≈0.000远远小于显著性水平α=0.05,所以方程是显著的,即变量x1 ,x2…x8整体对y有显著的影响,说明建立y与x1,x2,…x8之间的多元线性方程是正确的。但自变量整体对y的影响是显著的并不表明每个变量对y都是显著的,从表二中可知x4对y是不显著的,从而需要剔除掉不显著的变量。
表一:方差分析表
Model Regression Residual Total
Sum of Square
5.061 .265 5.326
df 8 22 30
Mean Square
.633 .012
F 52.5
Sig. .000
表二:系数表
模型 (constant)
x1 x2 x3 x4 x5 x6 x7 x8
三、自变量的筛选
用逐步回归法对自变量进行筛选,
表三:系数表
非标准化系数 B -8.381 .358 .069 .076 .001 .098 .196 .130 .155
标准误差 7.019 .022 .020 .013 .020 .025 .035 .027 .028
标准化系数 Beta .905 .217 .387 .002 .202 .363 .278 .356
t. 1.195 16.081 3.448 5.926 .044 3.912 5.635 4.8 5.530
Sig. .245 .000 .002 .000 .095 .001 .000 .000 .000
模型 (constant)
x1 x7 x3 x8 x6 x5 x2
非标准化系数 B -8.381 .358 .130 .076 .155 .196 .099 .069
标准误差 6.8 .022 .026 .013 .027 .033 .024 .020
标准化系数 Beta .905 .278 .387 .356 .363 .202 .217
t -1.221 16.556 4.986 6.0 5.665 5.924 4.058 3.553
Sig. .234 .000 .000 .000 .000 .000 .000 .002
从表三中可以得到进入的变量有七个,它们对y的影响都是显著的,将x4从模型中剔除了,说明x4对y并没有什么太大的影响,可以忽略不计,因此可得初步回归方程为:
y8.3810.358x10.130x70.076x30.155x80.196x60.099x50.069x2
各自变量对y的影响都是正影响。 四、违背基本假设的诊断
以回归标准化预计值为x轴,回归标准化残差为y轴做残差图,以便于分析模型是否存在异方差性或多重共线性,从残差图中可以看到方差有增大的趋势,于是初步判断模型存在异方差性。接下来诊断是否存在自相关性,运用SPSS软件得出DW值为2.112,与2很接近,判断方程是不存在自相关性的。用SPSS软件进行共线性诊断,得相关系数表,从表四可看到所有自变量的VIF值均小于10,从而可以得出方程不存在多重共线性。
表四:相关系数表
模型
非标准化系数
标准化系数 Beta .905 .278 .387 .356 .363 .202 .217
t
Sig.
相关系数
B 标准误差 6.8 .022 .026 .013 .027 .033 .024 .020
-1.221 16.556 4.986 6.0 5.665 5.924 4.058 3.553
.234 .000 .000 .000 .000 .000 .000 .002
Tolerance
.723 .695 .531 .6 .575 .870 .572
VIF 1.383 1.439 1.884 1.831 1.738 1.149 1.747
(constant) -8.381
x1 x7 x3 x8 x6 x5 x2
.358 .130 .076 .155 .196 .099 .069
四、消除异方差性
用加权最小二乘法消除数据间的异方差性,计算每个自变量与绝对残差之间的等级相关系数,选取与绝对残差等级相关系数最大的来构造权函数,最终确定选取x6交通通讯为最优权函数,得最终的系数表为:
表五
模型 (constant)
x1 x2 x3 x5 x6 x7 x8
非标准化系数 B -8.472 .356 .070 .076 .101 .196 .129 .156
标准误差 6.7 .022 .019 .012 .024 .033 .026 .027
标准化系数 Beta .903 .225 .388 .208 .371 .277 .365
标准误差
.055 .061 .0 .049 .062 .056 .063
t. -1.246 16.538 3.667 6.086 4.217 6.037 4.977 5.776
Sig. .225 .000 .001 .000 .000 .000 .000 .000
五、回归方程的最终确定及回归系数的解释 根据表五得最终的回归方程为
y8.4720.356x10.070x20.076x30.101x50.196x60.129x70.156x8,
标准回归方程为
y0.903x10.225x20.388x30.208x50.371x60.277x70.365x8
从方程可以知道所有自变量对y的影响都是显著的且都是正影响,由标准回归方程可知,食品对居民消费价格指数的影响是最显著的,其次是衣着,然后是交通通信,显著性最小的是医疗保健及个人用品。对回归系数的解释为:在其它自变量保持不变的情况下,食品每增加一个单位居民消费价格指数就相应的增加0.356个单位,在其它自变量保持不变的情况下,烟酒及用品每增加一个单位居民消费价格指数就相应的增加0.070个单位,对其它的回归系数的解释也是类似的。 六、结论
居民消费价格指数反映居民消费生活的连续性和居民生活的变化性,分析来看食品还是影响居民消费价格指数的主要因素,其次是衣着,然而发现交通通讯比居住更显著,我们知道前几年房价一直上涨,但随着的房价已经趋于平稳甚至呈下跌的趋势,而这时石油的价格却在慢慢的上涨直到最高却没下跌,这就导致了汽油和柴油的价格也随之上涨,但是居民没有别的选择,因为没有别的替代品,而且近几年电子产品频繁推新,人们也随之不断的跟随着潮流,这些导致交通通讯比居住要显著些。同时我们发现医疗保健对居民消费价格指数的显著性是最小的,因为那些医疗保健器材和费用都十分昂贵,大部分人们想使用却还没有达到那个消费水平。应该着重注意食品,衣着,交通通讯等几个方面,控制好粮食的价格,积极倡导居民节约使用汽油、柴油等资源并且大力开发新能源以缓解因石油资源紧缺而导致的石油价格一直上涨的趋势,加强使居民消费价格指数呈稳定状态,使经济稳定、快速的增长。 参考文献:
[1]何晓群 刘文卿 《应用回归分析》(第三版)北京:中国人民大学出版社 2011.8 [2]《中国统计年鉴2013》(光盘版)
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo0.com 版权所有 湘ICP备2023021991号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务