您的当前位置：首页数理统计大作业(北航)2014版

数理统计大作业(北航)2014版

来源：华佗健康网

应用数理统计

大作业一学院：学号：姓名：指导老师： 2014年12月21日

国民生产总值增量的多元线性回归模型

摘要：国民生产总值一直是衡量国家综合经济水平的重要指标，本文要讨论研究的是国民生产总值的增量趋势与各产业增值趋势间的多元线性关系[1]。本论文搜集了我国从1998至2012年15年的国民生产与各产业增量指标，拟定数个自变量，代入统计软件SPSS 19.0[2]对各影响因素进行了统计分析，综合分析结果模拟多元线性回归函数。模型建立之后，又将2013年数据作为测试集测试模型的拟合精确度，得到的结果达到预期值，得出模型建立较为成功。

关键词：逐步回归法，国民生产总值增量，线性拟合

一引言

国民生产总值（Gross Domestic Product）是在一定时期中，一个国家地区经济生产出的全部最终产品和劳务的价值，被公认为衡量国家经济状况的较佳指

XXXXXXX XXXXXXX XXX XXX

标。它不仅仅反映了一定的经济表现，还可以反映国家的综合国力与经济发展前景，作为经济的制定依据，研究我国的国民生产总值的制约因素成为了学者们的热点问题。下文就以1998年至2012年的统计数据为标准，利用SPSS软件作出了多元线性回归分析。

二统计分析

2.1变量说明

因变量

——国民生产总值增值（亿元）；

自变量

——第一产业增加值（亿元）

自变量

——第二产业增加值（亿元）

自变量

——第三产业增加值（亿元）

自变量

——工业增加值（亿元）

自变量

——建筑业增加值（亿元）

2.2统计数据

训练组 2012年 2011年 2010年 2009年 2008年 2007年 2006年 2005年 2004年 2003年 2002年 2001年国民生产总值增值(亿元) 46366.05 第一产业增第二产业增第三产业增工业增加值建筑业增加加值(亿元) 加值(亿元) 加值(亿元) (亿元) 值(亿元) 52373.63 235161.99 231934.48 199670.66 391.34 71591.25 47486.21 220412.81 205205.02 188470.15 31942.66 60609.99 40533.6 187383.21 173595.98 160722.23 26660.98 26857.38 35226 157638.78 148038.04 135239.95 22398.83 48235.12 33702 149003.44 131339.99 130260.24 18743.2 49495.88 28627 125831.36 111351.95 110534.88 15296.48 31377.06 24040 103719. 885.88 91310.94 12408.61 25059.03 22420 87598.09 74919.28 77230.78 10367.31 24055.58 21412.73 73904.31 561.29 65210.03 8694.28 190.07 17381.72 62436.31 56004.73 945.53 7490.78 10677.52 16537.02 536.77 498.9 47431.31 65.46 10440.62 15781.27 49512.29 44361.61 43580.62 5931.67 2000年 1999年 199537.5 14944.72 45555.88 38713.95 40033.59 5522.29 5274.77 14770.03 41033.58 33873.44 35861.48 5172.1 年 29.25 14817.63 39004.19 30580.47 34018.43 4985.76 表格2-11998~2012年训练集数据

第一产业增加值(亿元) 56957 建筑业增加值(亿元) 395 测试国民生产总值组 2013年

增值(亿元) 第二产业增第三产业增工业增加值加值(亿元) 加值(亿元) (亿元) 49375.11 249684.4 262203.8 2106.4 表格2-22013年测试集数据

以上数据来自《中国统计年鉴2013》[3]中收录的近15年全国国民生产总值增值数据，考察与各产业间增量趋势变化中关系密切并且直观上有线性关系的因素，因此选取了第一产业增值、第二产业增值、第三产业增值、工业总产值增值、建筑业增值五大因素为自变量。

2.3模型建立

建立多元线性模型：

将以上数据数据录入SPSS。

2.3.1自变量与因变量关系

利用SPSS统计分析得到各自变量与国民生产总值增值的散点图：

图2-1国民生产总值增值与第一产业增加值的散点图

图2-2国民生产总值增值与第二产业增加值的散点图

图2-3国民生产总值增值与第三产业增加值的散点图

图2-4国民生产总值增值与工业增加值的散点图

图2-5国民生产总值增值与建筑业增加值的散点图

由以上数据我们可以看出各产业的增量与国民生产总值增量的散点图都比较相似，因此无法直观地排除无关变量。

下一步，我们用SPSS自带的逐步回归分析法作进一步研究：输入／移去的变量a 模型 1 输入的变量工业增加值(亿元) 第三产业增加值(亿元) 移去的变量 . 方法步进（准则: F-to-enter 的概率<= .050，F-to-remove 的概率>= .100）。步进（准则: F-to-enter 的概率<= .050，F-to-remove 的概率>= .100）。

2 . a. 因变量: 国内生产总值增值(亿元) 图2-6 变量排除结果已排除的变量c 共线性统计量模型第一产业增加值(亿元) 第二产业增加值(亿元) 1 第三产业增加值(亿元) 建筑业增加值(亿元) 第一产业增加值(亿元) 2 第二产业增加值(亿元) 建筑业增加值(亿元) -4.011a -2.331a .078b .043b .007b -4.118 .001 -.765 .007 -3.178 .008 -.676 .015 .057 .005 .005 .955 .017 .996 .001 .996 .001 .004 7.779E-5 .003 Beta In -2.622a t Sig. 偏相关容差 -2.476 .029 -.581 .009 -15.202a -3.178 .008 -.676 .000 a. 模型中的预测变量: (常量), 工业增加值(亿元)。 b. 模型中的预测变量: (常量), 工业增加值(亿元), 第三产业增加值(亿元)。 c. 因变量: 国内生产总值增值(亿元) 图2-7排除变量的相关性数值在模型建立中，SPSS将第一产业与第二产业以及建筑业产业增值都剔除了，而保留了工业和第三产业的产业增值，由此可见，在五个自变量因素中，工业与第三产业的增量与国民生产总值增量的关联度较高，为目标函数提供的贡献度较大。因此，在以下的模型建立中，我们保留了这两个因素作为拟合自变量。

2.3.2 模型方案的建立系数a 非标准化系数模型 B 1 (常量) 标准系数 t B 的 95.0% 置信区间 Sig. 下限上限标准误差试用版 -2593.808 4801.903 --.0 .598 7780.073 12967.6 工业增加值(亿元) (常量) 工业增加值(亿元) 第三产业增加值(亿元) .339 -14838.874 1.835 .044 .906 7.699 .000 .244 -.434 4380.709 --.005 3.387 24383.619 5294.128 2.629 2 .3 4.903 5.035 .000 1.041 -4.118 -1.303 .316 -4.011 .001 -1.993 -.614 a. 因变量: 国内生产总值增值(亿元) 图2-8方案设计结果

方案一：以工业增加值为自变量得到拟合函数

方案二：以工业增加值和第三产业增加值为自变量得到拟合函数：

除了模型具体参数值，以下系统还给出了两模型方案的回归、残差分析表格，得出了其残差平方和与均方平方和数值： Anovac 模型回归 1 残差总计平方和 5.177E9 1.136E9 6.313E9 df 均方 1 5.177E9 F 59.268 Sig. .000a 由以上结果我们可以看出，系统提供给我们两个最终拟合方案。

13 87355376.604 14 回归 2 残差总计 5.842E9 4.705E8 6.313E9 2 2.921E9 74.499 .000b 12 39211809.744 14 a. 预测变量: (常量), 工业增加值(亿元)。 b. 预测变量: (常量), 工业增加值(亿元), 第三产业增加值(亿元)。 c. 因变量: 国内生产总值增值(亿元) 图2-8回归残差结果从结果可以得到，两个回归模型的F值分别为59.268与74.499，根据F分布表格，易查得，方案二的回归显著性更高。

因此我们选用模型二的拟合函数作为最终输出结果。

下面是回归标准化残差图：

图2-9回归残差结果

我们利用2013年数据进行拟合测试：

方案一：

方案二：

实际输出为：

可以看出，两个模型与实际结果的误差仍然较大，相比之下模型二更接近实际输出，但是仍不满足我们预期的结果，超出误差范围很大。因此此模型建立得不够完善，或者说，模型中自变量与因变量的线性关系仍不明显。

三结果分析

由于软件所建立模型在测试过程中仍然误差较大，所以可以得出这样的结论：

本模型中自变量第一产业增加值、第二产业增加值、第三产业增加值、工业增加值、建筑业增加值与因变量国民生产总值增值之间的线性关系不明显。

但综合来看，模型二较为可靠：

参考文献

[1] 孙海燕,周梦,李卫国,冯伟.应用数理统计[M].北京:北京航空航天大学数学系, 2014.

[2] 张建同,孙昌言. 以Excel和SPSS为工具的管理统计[M].北京:清华大学出版社，2002.

[3] 国家统计局.2010年中国统计年鉴[M]. 中国统计出版社，2013.

继续阅读

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文