(一)实验题目
某乐队经理研究其乐队CD盘的销售额(y),两个有关的影响变量是每周演出场次x1和乐队网站的周点击率x2,数据件下表:
(二)实验内容
(1)用普通最小二乘法建立y与x1和x2的回归方程,用残差图及DW检验诊断序列的自相关性。
Coefficientsa Standardized Unstandardized Coefficients Model 1 (Constant) 周演出场次 x1 周点击率x2 a. Dependent Variable: 销售额y B -574.062 191.098 2.045 Std. Error 349.271 73.309 .911 Coefficients Beta t -1.644 .345 .297 2.607 2.246 Sig. .107 .012 .029
回归方程为:y??574.062?191.098x1?2.045x2
残差图如下:
DW检验诊断 Model Summaryb Adjusted R Model 1 R .541a R Square .293 Square .264 Std. Error of the Estimate 329.69302 Durbin-Watson .745 a. Predictors: (Constant), 周点击率x2, 周演出场次 x1 b. Dependent Variable: 销售额y
从残差图中明显看出误差项呈正相关性
由模型图中可以看出DW=0.745 在(0,2)的范围内,并且??0.6275在(0,1)范围内 所以误差项呈正相关性
?(2)用迭代法处理序列相关,并建立回归方程。
此时首先计算出,?=1-(1/2)*DW=0.6275 将其带入
?y't=
yt-?*yt?1 以及
x1t?x1t??x1(t?1)
计算出,
'x2t'2t?x2t??x2(t?1)
y,xt''1t,
x然后再对
y,xt''1t,
x2t作普通最小二乘回归,计算结果如下:
更改统计量 Sig. F Durbin-Wa模型汇总b 调整 R 标准 估计R 方更模型 1 R .688a R 方 .473 方 的误差 改 F 更改 df1 2 df2 48 更改 .000 tson 1.716 .451 257.85878 .473 21.540 a. 预测变量: (常量), x2p, x1p。 b. 因变量: yp Anovab 模型 1 回归 残差 总计 平方和 2864465.709 3191575.287 6056040.996 df 2 48 50 均方 1432232.855 66491.152 F 21.540 Sig. .000a a. 预测变量: (常量), x2p, x1p。 b. 因变量: yp 系数a 非标准化系数 模型 1 (常量) x1p x2p a. 因变量: yp B -179.040 211.107 1.437 标准 误差 90.458 47.758 .629 标准系数 试用版 t -1.979 .521 .269 4.420 2.285 Sig. .054 .000 .027 B 的 95.0% 置信区间 下限 -360.919 115.082 .172 上限 2.839 307.132 2.701 由系数表可以知道,此时的回归方程为:还原为原始变量方程为:
y?'''=-179.040+211.107x1p+1.437x2p
y?t??179.040?0.6175y?211.107(x1t?x1(t?1))?1.437(x2t?x2(t?1))
t?1由回归系数检验的分别得到此时两个自变量的t值及P值分别为:t=4.420 P=0.000
''t=2.285 P=0.027 此时说明x1p对因变量的影响显著,而x2p对因变量的影响小。
(3)用一阶差分法处理数据,并建立回归方程。
首先先计算差分:
yd=?y?y?yttt?1,,,x1d??x1t?x1t?x1(t?1),,,,x2d??x2t?x2t?x2(t?1) ,然后用
?y,,?x1t,,?x2t作过原点的最小二乘估计,得到系数表如下:
t 模型汇总c,d 更改统计量 调整 R 标准 估计R 方更模型 1 R .715a R 方b .511 方 的误差 改 F 更改 df1 2 df2 49 Sig. F Durbin-Wa更改 .000 tson 2.040 .491 280.98995 .511 25.564 a. 预测变量: x2d, x1d b. 对于通过原点的回归(无截距模型),R 方可测量(由回归解释的)原点附近的因变量中的 可变性比例。 对于包含截距的模型,不能将此与 R 方相比较。 c. 因变量: yd d. 通过原点的线性回归 Anovac,d 模型 1 回归 残差 总计 a. 预测变量: x2d, x1d b. 因为通过原点的回归的常量为零,所以对于该常量此总平方和是不正确的。 c. 因变量: yd d. 通过原点的线性回归 平方和 4036879.696 3868812.376 7.906E6 df 2 49 51 均方 2018439.848 78955.355 F 25.564 Sig. .000a 系数a,b 非标准化系数 模型 1 x1d x2d a. 因变量: yd b. 通过原点的线性回归 B 210.117 1.397 标准 误差 43.692 .577 标准系数 试用版 .544 .274 t 4.809 2.421 Sig. .000 .019 B 的 95.0% 置信区间 下限 122.315 .237 上限 297.920 2.556 由系数表可以知道,此时,回归方程为:?变量为:
y?210.117?x?1t?1.397?x2t ,还原为原始
y?t?yt?1?210.117(x1t?x1(t?1))?1.397(x2t?x2(t?1))

