第三章 K元线性回归模型

2026/4/23 6:53:00

第三章 K元线性回归模型

一、填空题

1. 对于模型Yi??0??1Xi1??2Xi2????kXik?ui,i=1,2,…,n,一般经验认为,满足模型估计的基本要求的样本容量为_ _

2. 对于总体线性回归模型Yi??0??1Xi1??2Xi2??3Xi3?ui,运用最小二乘法欲得到参数估计量,所要求的最小样本容量n应满足 或至少_________。

3. 多元线性计量经济学模型的矩阵形式 ,对应的样本线性回归模型的矩阵形式 ,模型的最小二乘参数估计量 及其方差估计量 。

4. 总平方和可以分解为 和 ,可决系数为 。

5. 多元回归方程中每个解释变量的系数β(偏回归系数),指解释变量变化一个单位引起的被解释变量平均变化 个单位。

6. 线性模型的含义,就变量而言,指的是回归模型变量的 ;就参数而言,指的是回归模型中参数的 。通常线性回归模型指的是 。

二、问答题

1. 什么是多元回归模型?它与一元、二元回归模型有何区别? 2. 极大似然法(maximum likehood)的原理是什么? 3. 什么是拟合优度(R2)检验?有什么作用? 4. 可决系数R2低的可能的原因是什么?

5. 多元回归的判断系数R具有什么性质?运用R时应注意什么问题?

6. 多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有

效性的过程中,哪些基本假设起了作用? 7. 说明区间估计的含义。

2

2

三、实践题

1.下表给出三变量模型的回归结果:

方差来源 回归平方和(ESS) 残差平方和(RSS) 总平方和(TSS)

平方和(SS)

65965 66042

自由度(d.f.)

14

均方差(MSS)

要求:(1)样本容量是多少?(2)求RSS?(3)ESS和RSS的自由度各是多少?(4)

求R2和R?(5)检验假设:X1和X2对Y无影响。你用什么假设检验?为什么?(6)根据以上信息,你能否确定X1和X2各自对Y的贡献吗?

2.下面给出依据15个观察值计算得到的数据,其中小写字母代表了各值与其样本均值的离差。

Y?367.693 , X1?402.760 ,X22?8.0

,?yi?66042.269

yix1i?74778.346

2?x?21i?84855.096 ,

?x2i?280.0,

x2i?4796.02?yix2i?4250.9 ,

?x1i

2要求:(1)估计三个多元回归系数;(2)估计它们的标准差;并求出R2与R?(3)估计?1、?295%的臵信区间;(4)在?尾检验);(5)给出方差分析表。

3.考虑以下方程(括号内为估计标准差):n?19,R2?0.873

??8.562?0.364P?0.004PWitt?1?2.560Ut (0.080) (0.072) (0.658)

?5%下,检验估计的每个回归系数的统计显著性(双

其中:W—t年的每位雇员的工资和薪水;P—t年的物价水平;U—t年的失业率。 要求:(1)对个人收入估计的斜率系数进行假设检验;

(2)讨论Pt?1在理论上的正确性,对本模型的正确性进行讨论;Pt?1是否应从方程中删除?为什么?

4.克莱因和戈德伯格曾用1921-1941年与1945-1950年(1942-1944年战争期间略去)美国国内消费C和工资收入W、非工资—非农业收入P、农业收入A的共27年时间序列资料,利用普通最小二乘法估计得出了下列回归方程:

2Ct?8.133?1.059Wt?0.452Pt?0.121AtR?0.95, F?107.37, ( 8 . 9 (2 0 ). 1 7 ( )0 . 4 5( 21 ) . 0

式中括号中的数字为相应参数估计量的标准误。试对该模型进行评价,指出其中存在的问

F(3,23)?3.03, t0.025(23)?2.069题。(显著性水平??5%,已知0.05)

5.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为

edu?10.36?0.094sibs?0.131medu?0.210fedu,R=0.214

2

式中,edu为劳动力受教育年数,sibs为该劳动力家庭中兄弟姐妹的个数,medu与fedu分别为母亲与父亲受到教育的年数。问

(1)sibs是否具有预期的影响?为什么?若medu与fedu保持不变,为了使预测的受教育水平减少一年,需要sibs增加多少?

(2)请对medu的系数给予适当的解释。

(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少?

6.以企业研发支出(R&D)占销售额的比重为被解释变量(Y),以企业销售额(X1)与利润占销售额的比重(X2)为解释变量,一个有32个企业的样本估计结果如下:

Y?0.472?0.32log(X1)?0.05X2(1.37)(0.22)(0.046) ,2R?0.099

其中括号中为系数估计值的标准差。

(1)解释log(X1)的系数。如果X1增加10%,估计Y会变化多少个百分点?这在经济上是一个很大的影响吗?

(2)针对R&D强度随销售额的增加而提高这一备择假设,检验它不虽X1而变化的假设。分别在5%和10%的显著性水平上进行这个检验。

(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响?

(3)对X2,参数估计值的t统计值为0.05/0.46=1.087,它比在10%的显著性水平下的临界值还小,因此可以认为它对Y在统计上没有显著的影响。

7.下表为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值(括号内为p-值)(如果某项为空,则意味着模型中没有此变量)。数据为美国40个城市的数据。模型如下:

housing??0??1density??2value??3income??4popchang??5unemp??6localtax??7statetax??

式中housing——实际颁发的建筑许可证数量,density——每平方英里的人口密度,value——自由房屋的均值(单位:百美元),income——平均家庭的收入(单位:千美元),popchang——1980~1992年的人口增长百分比,unemp——失业率,localtax——人均交纳的

地方税,statetax——人均缴纳的州税 变量 C Density Value Income Popchang Unemp Localtax Statetax RSS R

Se2

模型A 813 (0.74) 0.075 (0.43) -0.855 (0.13) 110.41 (0.14) 26.77 (0.11) -76.55 (0.48) -0.061 (0.95) -1.006 (0.40) 4.763e+7 0.349 1.488e+6 1.776e+6

模型B -392 (0.81) 0.062 (0.32) -0.873 (0.11) 133.03 (0.04) 29.19 (0.06)

-1.004 (0.37) 4.843e+7 0.338 1.424e+6 1.634e+6

模型C -1279 (0.34) 0.042 (0.47) -0.994 (0.06) 125.71 (0.05) 29.41 (0.001)

4.962e+7 0.322 1.418e+6 1.593e+6

模型D -973 (0.44)

-0.778 (0.07) 116.60 (0.06) 24.86 (0.08)

5.038e+7 0.312 1.399e+6 1.538e+6

AIC

(1)检验模型A中的每一个回归系数在10%水平下是否为零(括号中的值为双边备择p-值)。根据检验结果,你认为应该把变量保留在模型中还是去掉?

(2)在模型A中,在10%水平下检验联合假设H0:?i =0(i=1,5,6,7)。说明被择假设,计算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的结论。

(3)哪个模型是“最优的”?解释你的选择标准。

(4)说明最优模型中有哪些系数的符号是“错误的”。说明你的预期符号并解释原因。确认其是否为正确符号。

参考答案 一、填空题

1.n≥30或至少n≥3(k+1);2. n≥30或至少n≥24;3.Y2Var(b)??u(X?X)ii?1?X??uY,

?Xb?e?1,b?(X?X)X?Y,

; 4.回归平方和;残差平方和;回归平方和与残差平方和之比。5. β ;

6.非线性;非线性;变量非线性而参数为线性。

二、问答题

1. 答:回归模型与一元线性回归模型的区别表现在如下几方面:一是解释变量的个数不同;二是模型的经典假设不同,多元线性回归模型比一元线性回归模型多了“解释变量之间不存在线性相关关系”的假定;三是多元线性回归模型的参数估计式的表达更复杂。

2. 答:极大似然法(ML)是不同于OLS法的另一种模型参数估计方法。ML方法需要利用有关模型随机扰动项分布的知识构建似然函数,然后利用使似然函数最大的方法得出参数估计。其基本思路是确定观察到的样本数据最可能来自某个分布,该分布的参数值即为总体参数的估计量。

3. 答:所谓拟合优度检验,指对样本回归直线与样本观测值之间拟合程度的检验。如果所有的观测值都落在回归线上,称为“完全拟合”。这种情况很少发生。一般情况下,总会出现围绕在回归直线周围的正或负的残差。通过对残差的分析,有助于衡量回归直线与样本观察值的拟合程度。反映回归模型拟合优劣的一个数量指标是样本可决系数R2,也称判定系数。另一个是对回归模型的F统计检验。估计方程的目的常常不是为了获得高R2,而是要得到可靠的参数估计,以便利用估计结果进行统计推断。注意不要将判断系数作为评价模型优劣的唯一标准。

4. 答:可能由于:X不是Y的良好解释变量;模型形式设定有误。一般地,利用时间序列数据估计的模型R值较高,而利用截面数据估计的模型R值较低。

5. 答:R的取值取决在0~1之间。若Y的全部变异都得到了解释,则R=1,若解释变量没有如何解释能力,有R2=0。在模型中不包含常数项的情况下,R2的值可能超出0~1范围;是解释变量的非减函数,即增加解释变量不会降低R2,在大多数情况下,R2会增大。

2

2

2

2


第三章 K元线性回归模型.doc 将本文的Word文档下载到电脑
搜索更多关于: 第三章 K元线性回归模型 的文档
相关推荐
相关阅读
× 游客快捷下载通道(下载后可以自由复制和排版)

下载本文档需要支付 10

支付方式:

开通VIP包月会员 特价:29元/月

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:xuecool-com QQ:370150219