2016_2017学年高中数学第三章统计案例3.1第2课时残差分析及回归模型的选择学案

2026/4/27 23:53:11

比较合适.

2

计算相关指数R=0.986 3,说明城镇居民的月人均生活费的差异有98.63%是由人均收人引起的.

?=0.6599x-58.751来作月生活费的预报值. 由以上分析可知.我们可以利用回归方程y?=784.64(元); 将x=1100代人得,y?=850.63(元). 将x=1200代人得,y故预测月人均收人分别为1100元和l200元的两家庭的月人均生活费分别为784.64元和

850.63元 归律总结:如果作出的残差图中的残差点比较均匀地分布在水平的带状区域中,带状区域宽

2

度越窄,说明模型拟合程度越高,回归方程的预报精度越高.若利用相关指数R来刻画拟合

2

效果的好坏,R的取值越接近1,说明残差的平方和越小,即说明模型的拟合效果越好. 变式训练:在一段时间内,某种商品的价格x(元)与需求量y(件)之间的数据为 价格x(元) 需求量y(件) 14 56 16 50 18 43 20 41 22 37 求出y对x的回归直线方程,并说明拟合效果的好坏.

题型三:非线性回归分析

例3 现代经济学证明,工厂生产产品的成本与其产量有关,产量越大,其成本越低.某饰品工艺厂在生产某种民族特色艺术品时,得到了每件饰品的成本费y(元)与产量x(百件)之间的如下数据: x y x y 1 20 1.62 2 30 1.41 3 4.08 50 1.30 5 2.85 100 1.21 10 2.11 200 1.15 10.15 5.52 检验每件饰品的成本费y与产量x之间是否具有线性相关关系,若有,求出y对x的回归方程;若没有,你能求出y与x的一个关系式吗? 思路导析:通过散点图观察两个变量具备怎样的相关关系,根据相关关系的特征选择合适的模型,将非线性相关的关系通过置换变为线性相关关系,然后求出成本与产量之间的关系. 解析:画出x和y的散点图,如图.

5

图中的点的分布不在一条直线附近,故每件饰品的成本费y与产量x间不具有线性相关关系,又图中的点的分布近似于反比例函数中的一支,故可把

1置换为u,检验y与u之x间的相关关系,则有u=

u 1 yi 1,从而u与y的数据为 x0.33 4.08 0.2 2.85 0.1 2.11 0.05 1.62 0.03 1.41 0.02 1.30 0.01 1.21 0.005 1.15 0.5 10.15 5.52 然后作相关性检验. 经计算得r=0.9998,

因为|r|接近于1,所以可以认为两个变量y与u之间具有较强线性相关关系;

?=1.125, b?=8.973,所以y?=1.125+8.973u, 由公式得a18.973??1.125?,可得y.

xx8.973??1.125?答:y对x的回归方程为y.

x最后回代u=

方法规律:非线性回归问题要先根据已知的数据画出散点图,并把散点图与已经学习过的各种函数,如幂函数、指数函数、对数函数、二次函数等作比较,挑选出跟这些散点拟合最好的函数,然后再采用变量的置换,把问题转化为线性回归分析问题解决.

变式训练:在兰新化工厂生产某种化学药品的生产车间内,技术人员测得如下表所示的6组数据,其中x?min?表示化学反应进行的时间,y?mg?表示未转化物质的量.

x/min y?mg? 1 2 3 25.4 x4 20.3 5 16.2 6 13.3 39.8 32.2 (1)设y与x之间具有关系y?cd,试根据测量数据估计c和d的值.

(2)估计化学反应进行到10min时未转化的物质的量.

四、随堂练习

1.变量x、y的散点图如图所示,那么x、y之间的样本相关系数r的最接近的值为( )

6

A.1 B.-0.5 C.0 D.0.5

2.为了考察两个变量x和y之间的线性相关性.甲、乙两位同学各自独立地做10次和15次试验,并且利用线性回归方程,求得回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都为t,那么下列说法正确的是( )

A. l1与l2相交点为(s,t); B.l1与l2相交,相交点不一定是(s,t); C. l1与l2必关于点(s,t)对称; D. l1与l2必定重合. 3.对于相关系数r,下列说法中正确的是( )

A.|r|越大,相关程度越大 B.|r|越小,相关程度越大 C.|r|越大,相关程度越小;|r|越小,相关程度越大

D.|r|?1且|r|越接近1,相关程度越大;|r|越接近0,相关程度越小

4.如图所示,有5组数据(x,y),去掉_____组数据后,剩下的4组数据的线性相关系数最大.

5. 已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是______。

6. 某产品的广告费用支出x与销售额y(单位:百万元)之间有如下统计数据:

x y 2 30 4 40 5 60 6 50 8 70 请对上述变量x、y进行相关性检验.

五、课后作业

1. 某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是 ( ) A. y??10x?200 B. y?10x?200 C. y??10x?200 D. y?10x?200 2.对两个变量x与y进行回归分析,分别选择了4个不同模型,它们的相关系数r如下,其

^^^^ 7

中拟合效果最好的模型是( ) A.模型1的相关系数r为0.98 B.模型2的相关系数r为0.80 C.模型3的相关系数r为0.50 D.模型4的相关系数r为0.25

3.线性相关的四个样本点(x,3.5),(2.5,6.2),(4.4,y),(5.2,11.3)的中心是(3.4,7.75),则

x?___,y?___

??2x?3,若4.已知一系列样本点(xi,yi)(i?1,2,3,?,n)的回归直线方程为y则

?xi?1ni?17,

?yi?1ni?

5.某矿脉中设有9个样本点,某种金属的含量y与样本点到原点的距离x有如下表的测量值:

x y 2 106.42 请按y?a?3 4 5 7 8 10 15 18 108.20 109.58 109.50 110.00 109.93 110.49 110.90 111.00 b建立y对x的回归方程,并预测当样本点到原点的距离x?20时,该种x金属的含量.

6.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下: x y 15.0 39.4 25.8 42.9 30.0 42.9 36.6 43.1 44.4 49.2

(1)求y与x之间的回归方程,对于基本苗数56.7预报有效穗. (2)计算各组残差,并计算残差平方和.

(3)求R2,并说明残差变量对有效穗的影响占百分之几?

参考答案

3.1 第二课时 选择回归模型

2.基础预探

1.随机误差 2.残差 3. 残差分析 4. 越小 越好 三、典例导析 例1 变式训练

解析:由题意可知:x?77.7,y?165.7,

8


2016_2017学年高中数学第三章统计案例3.1第2课时残差分析及回归模型的选择学.doc 将本文的Word文档下载到电脑
搜索更多关于: 2016_2017学年高中数学第三章统计案例3.1第2课时残 的文档
相关推荐
相关阅读
× 游客快捷下载通道(下载后可以自由复制和排版)

下载本文档需要支付 10

支付方式:

开通VIP包月会员 特价:29元/月

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:xuecool-com QQ:370150219