回归分析的基本思想及其初步应用
(第1课时)学案 班级 姓名
[自学要求]
1、了解线性回归模型及相应概念并能区分线性回归模型与一次函数模型。2、了解回归分析中的有关概念及意义,了解相关指数的概念与作用,了解残差分析的意义。3、了解建立线性回归模型的大致步骤。 [自学过程]
1、由两相关变量的散点图可看出,样本点散布在某条直线附近,而不是在这条直线上,所以不能用一次函数
y?bx?a来描述他们之间的关系,而是用线性回归模型 来表示,其中a,b为待定的参数,y称
为 ,它的取值是具体的观测值,x称为 ,e称为 ,也称为 ,散点和它在回归直线上的相应位置的差yi?yi是随机误差e的效应,称为残差,所有差的平方和称为残差平方和,它代表了随机误差的效应。
2、残差图中,纵坐标必须是 ,横坐标可以选取 ,或解释变量,或预报变量的值。 3、刻画回归效果的方式一般有三种:
(1)利用相关指数R刻画回归效果:其计算公式为:R= ,其几何意义是 ,表示回归效果越好; ,表示回归效果越差。
(2)残差图法:残差点比较均匀地落在 ,说明选用的比较合适,其中这个带状区域宽度 ,说明模型拟合精度越高,回归方程的预报精度越高。
(3)残差平方和:残差平方和为 ,残差平方和 ,模型拟合效果越好。 4、残差= = 残差平方和= 回归平方和= 总偏差平方和= 5、实际问题中利用回归模型作出预报时应注意的问题是:
(1) (2) (3) (4) 6、建立回归模型的基本步骤:
(1) (2) (3) (4) (5) [课堂展示]
例: 在一段时间内,某中商品的价格x元和需求量Y件之间的一组数据为:
22?
求出Y对x的回归直线方程,并说明拟合效果的好坏。 ( 保留2位有效数字)
55522 xi?1660,?yi?327,?xiyi?620,?i?1i?1i?1
练习:假设关于某设备的使用年限x和所支出的维修费用y(万元)
1
使用年限x 维修费用y 2 2.2 3 3.8 4 5.5 5 6.5 6 7.0 (1)试对x与y进行回归分析,并预测使用年限为10年时维修费用为多少? (2)作出残差图,并求残差平方和;
(3)求相关指数R,并分析模型的拟合效果
[课堂小结]
回归分析与相关分析的区别:(1)相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化(2)相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量(3)相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制 [课堂检测]
1、下列关于回归分析的描述正确的是
A.相关指数R越接近0,模型拟合效果越好 B.回归平方和=总偏差平方和+残差平方和 C残差平方和越小的模型,拟合效果越好D用回归方程得到的预报值是预报变量的精确值 2、若一个样本的总偏差平方和256,残差平方和32,则回归平方和为( ) A.224 B.288 C.320 D.192
3、一项研究要确定是否能够根据施肥量预测作物的产量,这里的解释变量是( ) A、作物的产量 B、施肥者 C、实验者 D、降雨量或其他解释产量的变量 4、若一个样本的总偏差平方和为80,残差平方和为60,则相关指数R为( ) A.
2223131 B. C. D. 42845、下列关于线性回归模型拟合数据的叙述①回归方程只适用于我们所研究的样本的总体②我们建立的回归方
程一般都有时间性③样本取值的范围,不会影响回归方程的适用范围④回归方程得到的预报值是预报变量可能取值的平均值其中正确的是( )A.①② B.①②③ C.①③④ D.①②④ 6.为了表示n个点与相应直线在整体上的接近程度,我们常用( )表示 ?i) B. ?(y?i?yi) C. ?(yi?y?i)2 D. ?(yi?yi)2 A.?(yi?yi?1i?1i?1i?1nnnn7.、在两个变量x与y的回归模型中,分别选择了4个不同的模型,它们的R如下,其中拟合效果最差的是( ) A、模型1的R为0.95;B、模型1的R为0.88;C、模型1的R为0.50;D、模型1的R为0.30; 8、关于残差图的描述错误的是( )
A、残差图的横坐标可以是样本编号 B、残差图的横坐标可以是解释变量 C、残差点分布的带状区域的宽度越窄相关指数越小 D、残差点分布的带状区域的宽度越窄回归平方和越大
9.已知两个变量的回归模型为y?1.3x?4?e,则样本点(2,7)的残差e为 10.若一组观测值(x1,y1),(x2,y2),?,(xn,yn)之间满足yi?a?bxi?ei(i?1,2,3,?),若ei恒为0,则R为
2
?222222

