比较合适.
2
计算相关指数R=0.986 3,说明城镇居民的月人均生活费的差异有98.63%是由人均收人引起的.
?=0.6599x-58.751来作月生活费的预报值. 由以上分析可知.我们可以利用回归方程y?=784.64(元); 将x=1100代人得,y?=850.63(元). 将x=1200代人得,y故预测月人均收人分别为1100元和l200元的两家庭的月人均生活费分别为784.64元和
850.63元 归律总结:如果作出的残差图中的残差点比较均匀地分布在水平的带状区域中,带状区域宽
2
度越窄,说明模型拟合程度越高,回归方程的预报精度越高.若利用相关指数R来刻画拟合
2
效果的好坏,R的取值越接近1,说明残差的平方和越小,即说明模型的拟合效果越好. 变式训练:在一段时间内,某种商品的价格x(元)与需求量y(件)之间的数据为 价格x(元) 需求量y(件) 14 56 16 50 18 43 20 41 22 37 求出y对x的回归直线方程,并说明拟合效果的好坏.
题型三:非线性回归分析
例3 现代经济学证明,工厂生产产品的成本与其产量有关,产量越大,其成本越低.某饰品工艺厂在生产某种民族特色艺术品时,得到了每件饰品的成本费y(元)与产量x(百件)之间的如下数据: x y x y 1 20 1.62 2 30 1.41 3 4.08 50 1.30 5 2.85 100 1.21 10 2.11 200 1.15 10.15 5.52 检验每件饰品的成本费y与产量x之间是否具有线性相关关系,若有,求出y对x的回归方程;若没有,你能求出y与x的一个关系式吗? 思路导析:通过散点图观察两个变量具备怎样的相关关系,根据相关关系的特征选择合适的模型,将非线性相关的关系通过置换变为线性相关关系,然后求出成本与产量之间的关系. 解析:画出x和y的散点图,如图.
5
图中的点的分布不在一条直线附近,故每件饰品的成本费y与产量x间不具有线性相关关系,又图中的点的分布近似于反比例函数中的一支,故可把
1置换为u,检验y与u之x间的相关关系,则有u=
u 1 yi 1,从而u与y的数据为 x0.33 4.08 0.2 2.85 0.1 2.11 0.05 1.62 0.03 1.41 0.02 1.30 0.01 1.21 0.005 1.15 0.5 10.15 5.52 然后作相关性检验. 经计算得r=0.9998,
因为|r|接近于1,所以可以认为两个变量y与u之间具有较强线性相关关系;
?=1.125, b?=8.973,所以y?=1.125+8.973u, 由公式得a18.973??1.125?,可得y.
xx8.973??1.125?答:y对x的回归方程为y.
x最后回代u=
方法规律:非线性回归问题要先根据已知的数据画出散点图,并把散点图与已经学习过的各种函数,如幂函数、指数函数、对数函数、二次函数等作比较,挑选出跟这些散点拟合最好的函数,然后再采用变量的置换,把问题转化为线性回归分析问题解决.
变式训练:在兰新化工厂生产某种化学药品的生产车间内,技术人员测得如下表所示的6组数据,其中x?min?表示化学反应进行的时间,y?mg?表示未转化物质的量.
x/min y?mg? 1 2 3 25.4 x4 20.3 5 16.2 6 13.3 39.8 32.2 (1)设y与x之间具有关系y?cd,试根据测量数据估计c和d的值.
(2)估计化学反应进行到10min时未转化的物质的量.
四、随堂练习
1.变量x、y的散点图如图所示,那么x、y之间的样本相关系数r的最接近的值为( )
6
A.1 B.-0.5 C.0 D.0.5
2.为了考察两个变量x和y之间的线性相关性.甲、乙两位同学各自独立地做10次和15次试验,并且利用线性回归方程,求得回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都为t,那么下列说法正确的是( )
A. l1与l2相交点为(s,t); B.l1与l2相交,相交点不一定是(s,t); C. l1与l2必关于点(s,t)对称; D. l1与l2必定重合. 3.对于相关系数r,下列说法中正确的是( )
A.|r|越大,相关程度越大 B.|r|越小,相关程度越大 C.|r|越大,相关程度越小;|r|越小,相关程度越大
D.|r|?1且|r|越接近1,相关程度越大;|r|越接近0,相关程度越小
4.如图所示,有5组数据(x,y),去掉_____组数据后,剩下的4组数据的线性相关系数最大.
5. 已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是______。
6. 某产品的广告费用支出x与销售额y(单位:百万元)之间有如下统计数据:
x y 2 30 4 40 5 60 6 50 8 70 请对上述变量x、y进行相关性检验.
五、课后作业
1. 某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是 ( ) A. y??10x?200 B. y?10x?200 C. y??10x?200 D. y?10x?200 2.对两个变量x与y进行回归分析,分别选择了4个不同模型,它们的相关系数r如下,其
^^^^ 7
中拟合效果最好的模型是( ) A.模型1的相关系数r为0.98 B.模型2的相关系数r为0.80 C.模型3的相关系数r为0.50 D.模型4的相关系数r为0.25
3.线性相关的四个样本点(x,3.5),(2.5,6.2),(4.4,y),(5.2,11.3)的中心是(3.4,7.75),则
x?___,y?___
??2x?3,若4.已知一系列样本点(xi,yi)(i?1,2,3,?,n)的回归直线方程为y则
?xi?1ni?17,
?yi?1ni?
5.某矿脉中设有9个样本点,某种金属的含量y与样本点到原点的距离x有如下表的测量值:
x y 2 106.42 请按y?a?3 4 5 7 8 10 15 18 108.20 109.58 109.50 110.00 109.93 110.49 110.90 111.00 b建立y对x的回归方程,并预测当样本点到原点的距离x?20时,该种x金属的含量.
6.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下: x y 15.0 39.4 25.8 42.9 30.0 42.9 36.6 43.1 44.4 49.2
(1)求y与x之间的回归方程,对于基本苗数56.7预报有效穗. (2)计算各组残差,并计算残差平方和.
(3)求R2,并说明残差变量对有效穗的影响占百分之几?
参考答案
3.1 第二课时 选择回归模型
2.基础预探
1.随机误差 2.残差 3. 残差分析 4. 越小 越好 三、典例导析 例1 变式训练
解析:由题意可知:x?77.7,y?165.7,
8

