分析:如图所示是后退逐步回归的模型预测,左边是预测图,两条细线表示预测值的两倍标准误差带,右边是有关预测的一些评价指标。从他的误差带我们可以看出回归模型同样较为精确,误差带紧随实际曲线变动,而却紧随的效果要比前进回归模型的要好,贴近实际曲线的效果也前进逐步回归模型的好,再从右边的评价指标RMSE值为83.93419,MAE值为67.52228,MAPE值为1.320141,都比前进逐步回归模型的数值小,从而可以判定模型的预测能力比前进逐步回归模型的预测好,精度高。
第9章 多重共线性的诊断及消除
9.1 多重共线性的诊断
由于Eviews软件无法对模型多重共线作出诊断,因此这里我们就用spss19.0软件对模型做共线性诊断,关键的输出结果见下表(限于篇幅就对表格做出调整,只输出关键的结果)。 模型 VIF 常量 X1 X2 X3 133.044 X4 947.996 X5 329.438 X6 182.413 X7 416.185 X8 701.380 61.091 413.326 分析:从表中的输出结果可以看出,x2,x4,x5,x7,x8的方差扩大因子VIF都很大,远远的超过了10,说明成品钢材需求量的回归方程存在着严重的多重共线性。又因为x1,x2,x3,x4,x5,x6,x7,x8的方差扩大因子都是大于10的,说明回归方程的多重共线性就是
由自变量间的多重共线性引起的。
a共线性诊断 方差比例 条件索(常模型 维数 特征值 引 量) 1 1 2 3 4 5 6 7 8 9 a. 因变量: y 分析:从条件数可以看到,最大的条件数k9?453.668,说明自变量间存在严重的多重共线性,这一判断与上面的方差扩大因子法判断结果一致。表中的方差比例是按从小到大的顺序排列的,不是按自变量顺序排列的,这与方差扩大因子不同。在维数为9的时候,我
14
x1 .00 .00 .00 .00 .00 .26 .07 .02 .65 x2 .00 .00 .00 .00 .02 .02 .30 .53 .11 x3 x4 x5 x6 x7 x8 8.321 1.000 .00 .659 3.553 .00 .011 27.458 .04 .004 43.444 .01 .003 57.552 .00 .001 106.541 .12 .000 157.928 .05 .000 213.430 .01 4.043E-5 453.668 .78 .00 .00 .00 .00 .00 .00 .00 .00 .00 .00 .00 .00 .01 .00 .00 .00 .01 .00 .00 .00 .00 .31 .08 .00 .04 .01 .00 .11 .06 .05 .08 .02 .00 .05 .00 .02 .05 .02 .00 .03 .50 .69 .39 .36 .03 .41 .01 .18 .43 .60 .97 .09 .35 .05
们可以看到x1,x2,x5,x6的系数都很快的增大要接近1,这也可以说明x1,x2,x5,x6之间存在较强的多重共线性。
9.2 消除多重共线性
在前面多重共线性的诊断中我们看到x4的方差扩大因子VIF4?947.996为最大,因此剔除x4,建立y与x1,x2,x3,x5,x6,x7,x8的回归方程。关键的输出结果见下表(限于篇幅就对表格做出调整,只输出关键的结果)。 模型 VIF 常量 X1 X2 X3 130.880 X5 174.510 X6 133.668 X7 372.202 X8 525.920 38.881 248.129 分析:从剔除了自变量x4的回归模型中我们可以看到x8的方差扩大因子VIF8?525.920为最大,却远大于10,因此再剔除x8,建立y与x1,x2,x3,x5,x6,x7的回归
方程。关键的输出结果见下表(限于篇幅就对表格做出调整,只输出关键的VIF结果)。 模型 VIF 常量 X1 35.514 X2 169.934 X3 108.057 X5 174.510 X6 132.017 X7 101.870 分析:从剔除了自变量x4,x8的回归系数表中我们可以看到x5的方差扩大因子VIF5?174.510为最大,却远大于10,因此再剔除x5,建立y与x1,x2,x3,x6,x7的回归方
程。相关输出结果如下: 模型 VIF 常量 X1 23.178 X2 93.590 X3 23.358 X6 124.084 X7 64.691 分析:从剔除了自变量x4,x8,x5的回归系数表中我们可以看到x6的方差扩大因子VIF6?124.084为最大,还是远大于10,因此再剔除x6,建立y与x1,x2,x3,x7的回归方程。
相关输出结果如下:
模型 VIF 常量 X1 16.425 X2 49.766 X3 23.101 X7 24.008 分析:从剔除了自变量x4,x8,x5,x6的回归系数表中我们可以看到x2的方差扩大因子
VIF2?49.766为最大,还是大于10,因此再剔除x2,建立y与x1,x3,x7的回归方程。相
关输出结果如下: 模型 VIF 常量 X1 15.743 X3 19.226 X7 4.511 分析:从剔除了自变量x4,x8,x5,x6,x2的回归系数表中我们可以看到x3的方差扩大因
15
子VIF3?19.226为最大,还是大于10,因此再剔除x3,建立y与x1,x7的回归方程。相关输出结果如下: 模型 VIF 常量 X1 3.694 X7 3.694 分析:从剔除了自变量x4,x8,x5,x6,x2,x3的回归系数表中我们可以看到,剩下的自变量x1,x7的方差扩大因子分别为VIF1?3.694,VIF7?3.694,都是小于10的,而却回归系数也都有合理的社会经济解释,说明此回归模型不存在较强的多重共线性了,可以作为最终的回归模型。现在我们用Eviews软件建立y与x1,x7的回归模型: Variable Coefficient Std. Error t-Statistic C -2210.934 1272.616 -1.737314 X1 0.439863 0.109724 4.008811 X7 0.161103 0.018294 8.806406 R-squared 0.972630 Mean dependent var
Adjusted R-squared 0.969209 S.D. dependent var S.E. of regression 470.2027 Akaike info criterion Sum squared resid 3537450. Schwarz criterion Log likelihood -142.2374 Hannan-Quinn criter. F-statistic 284.2909 Durbin-Watson stat Prob(F-statistic) 0.000000
y与x1,x7的回归方程为
???2210.934?0.439863x1?0.161103x7 y Prob. 0.1015 0.0010 0.0000 5742.518 2679.609 15.28814 15.43727 15.31338 0.568156
由标准化的回归方程我们可以看到,对成品钢材需求量影响较大的事原油产量和居民消费,从社会经济角度来考虑,这是贴近人民生活的两个量,其中居民消费的系数较大,影响也就较大。从整体上来看,消除多重共线性影响后得回归方程更较为符合社会实际。
R-squared 0.972630
Adjusted R-squared 0.969209 F-statistic 284.2909 Prob(F-statistic) 0.000000
由F?284.2909,P值=0.000,分析:从表中输出结果可以看出,Prob即显著性P值,
可知此回归方程仍然具有高度的显著,即做出2个自变量整体对因变量y产生显著线性影响的判断所犯错误的概率仅为0.000。再从剔除了自变量x4,x8,x5,x6,x2,x3的新回归方程的
16
样本决定系数R2?0.972630,调整样本决定系数Ra?0.969209。而y对8个自变量的全模型的样本决定系数R2?0.999009,调整样本决定系数Ra?0.998215。与全模型相???2210.934?0.439863x1?0.161103x7的拟合优度仍然很高,并且回归系数有合理比y22的经济解释。
第10章 回归模型总结
随着社会经济的不断发展,科学技术的不断进步,统计方法越来越成为人们必不可收的工具盒手段。应用回归分析是其中的一个重要分支,本着国家经济水平的不断提高,我们采用回归分析的方法对我国成品钢材的需求量进行分析应用。为了使分析的模型具有社会实际意义,我们引用了1980——1998年的成品钢材、原油、生铁、原煤、发电量、铁路货运量、固定资产投资额、居民消费、政府消费9个不同的量来进行回归分析。
通过问题分析及假设建立了初步多元线性回归,再借用Eviews软件对数据进行了初步的预处理分析,得出数据符合做多元线性回归的要求。最后我们用Eviews软件给各变量做了初等多元线性回归并得到了回归方程。我了更多的了解多元线性回归方程的特征,我们对回归方程进行了F检验,T检验,将通过T检验的变量在建立回归方程分析。对于初等回归模型的稳定性,我们采用了Chow断点检验和Chow预测检验,最终检验出了模型是稳定的。然后又对初等模型否违背原假设做了异方差性检验,自相关性检验。异方差性的检验我们采用了作残差图和怀特检验法,很好的检验出了初等回归模型没有异方差性;自相关我们采用了DW检验,最终检验出了初等模型有轻微的负自相关性。为了模型更贴近实际,我们又分别进行了前进逐步回归,后退逐步回归的分析,并对两种逐步回归做了模型预测,在两种逐步回归法得到的结论中我们发现采用后退逐步回归得到的回归模型比前进逐步回归得到的模型要好一些,更为接近预测值。并且在分析中我们发现了变量之间存在共线性,因此我们又进一步借助spss软件对变量之间的多重共线性给了诊断,最后确定了确实存在多重共线性,从而又进一步对多重共线性给予了消除,重新建立了符合实际的线性回归方程。
17

