第七章 相关与回归分析
相关分析
一、函数关系、相关关系的 概 念 1、函数关系:
函数关系是一种严格的依存关系 ,这种关系可以用y = f(x)的方程来表现。 2、相关关系: 相关关系是一种不完全确定的随机关系。
函数关系与相关关系的联系:对具有相关关系的现象进行分析时,必须利用相应的函数关系的数学表达式来表明现象之间的相关方程式。 四、相关关系的判别方法 (一)相 关 图 表
利用直角坐标系第一象限,把自变量置于横轴上,因变量置于纵轴上,在将两变量相对应的变量值用坐标点形式描绘出来即可。
利用相关图可以:判断现象之间有无相关关系、观察相关关系的类型、观察相关关系的密切程度
(二)相关系数
相关系数是测定变量之间相关密切程度的统计指标。 1.简单线性相关系数
1. 对变量之间关系密切程度的度量
2. 对两个变量之间线性相关程度的度量称为简单相关系数
3. 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为? 4. 若是根据样本数据计算的,则称为样本相关系数,记为 r 总体相关系数的定义式是:
Cov(X,Y) ρ= (7.1) Var(X)Var(Y)
式中,Cov(X,Y)是变量X和Y的协方差;
Var(X)和Var(Y)分别为变量X和Y的方差。
总体相关系数是反映两变量之间线性相关程度的一种特
征值, 表现为一个常数。 2 xy样本相关系数的定义公式实质
xy
2??(x?x)(y?y)?式中:xy,是变量 和 n
的协方差。
(x?x)2? ?x?,是变量 的标准 n 差。
(y?y)2? ?y?,是变量 的标准n
?r???xyxy差。
相关系数按“积差法”计算。该方法是通过两变量与各自平均值的离差的乘积来反映两变量之间的相关程度。 12(x?x)(y?y)?xy积差法公式为: n????x?y (x?x)2(y?y)22计算相关系数的简化式: nn nxy?xy ??22 nx2?xny2?y 相关系数的性质
1. r 的取值范围是 [-1,1] 2. |r|=1,为完全相关 r =1,为完全正相关 r = -1,为完全负正相关
3 .r = 0,不存在线性相关关系,它并不意味着X与Y之间不存在其他类型的关系。 4 .-1?r<0,为负相关 5 0 6 6.|r|的数值愈接近于1,表示x与y直线相关程度愈高;反之, |r|的数值愈接近 于0,表示x与y直线相关程度愈低。 7 7.通常判断的标准是: |r|<0.3称为微弱相关, 0.3≤ |r|<0.5称为低度相关, 0.5≤ |r|<0.8称为显著相关(中度相关) 0.8≤ |r|<1称为高度相关或强相关。 一、回 归 分 析 的 意 义 回归分析是对具有相关关系的两个或两个以上变量之间的数量变化的一般关系进行测定,确立一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估算预测提供一个重要的方法. 三、回归分析与相关分析的区别 1、回归分析必须区分自变量和因变量,而相关分析不必区分。 2、回归分析的两个变量一个是自变量,一个是因变量,通过给定自变量的值来推算因变量的可能值;而相关分析的两个变量都是随机变量。 3、回归分析中对于因果关系不甚明确的两个变量,可以建立两个回归方程;而相关分析只能计算出一个相关系数。 4、一种回归方程只能做一种推算,即只能给出自变量的值来推算因变量的值,不能逆推。 四、回归分析的特点 1、在两个变量之间,必须根据研究目的具体确定自变量和因变量 2、回归方程的作用是给定自变量数值情况下,估计因变量的可能值。一个回归方程只能做一种推算 3、直线回归方程中,自变量为回归系数,回归系数为正时,表明正相关,回归系数为负时,表明负相关 4、确定回归方程时,只要求因变量是随机的,而自变量是给定的数值 五、一元线性回归方程确定 ???r??(x?x)(y?y)?(x?x)?(y?y)2???????????????y?a?bx1、一元线性方程式的一般形式: (当两变量的增长比率为常数时,它们之间就呈现为一种一元线性关系。) 一元线性回归方程进行回归分析的前提: 所分析的两个变量之间必须存在相关关系,且相关程度在显著相关以上。 在两变量相关的散点图中,引出一条最优的直线,这条直线就是估计回归线。它表明了两变量数量变动的一般关系。配合估计回归线的方程称为回归方程 方程式为: yc:因变量的估计值,c a:直线的起点值,回归系数b的经济涵义: b:直线的斜率,又称回归系数当自变量变动一个单位时,因变量的平均变动值。 x:自变量 y?a?bx一、判断题 1.产品的单位成本随着产量增加而下降,这种现象属于函数关系。 答:错。应是相关关系。单位成本与产量间不存在确定的数值对应关系。 2.相关系数为0表明两个变量之间不存在任何关系。 答:.错。相关系数为零,只表明两个变量之间不存在线性关系,并不意味着两者间不存在其他类型的关系。 3.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。 答:对,因果关系的判断还有赖于实质性科学的理论分析。 4.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。 答:错。两者是精确的函数关系。 5.总体回归函数中的回归系数是常数,样本回归函数中的回归系数的估计量是随机变量。 答:对。 6.当抽取的样本不同时,对同一总体回归模型估计的结果也有所不同。 答:对。因为,估计量属于随机变量,抽取的样本不同,具体的观察值也不同,尽管使用的公式相同,估计的结果仍然不一样。 二、选择题 1.变量之间的关系按相关程度分可分为:(b、c、d) a.正相关; b. 不相关; c. 完全相关; d.不完全相关; 2.复相关系数的取值区间为:(a) a. 0?R?1; b.?1?R?1; c.???R?1; d.?1?R?? 3.修正自由度的决定系数(a、b、d) 2a.R?R; b.有时小于0 ; c. 0?R?1; 22d.比R更适合作为衡量回归方程拟合程度的指标 4.回归预测误差的大小与下列因素有关:(a、b、c、d) a 样本容量; b自变量预测值与自变量样本平均数的离差 c自变量预测误差; d 随机误差项的方差 1.相关分析是研究变量之间的D A.数量关系 B.变动关系 C.因果关系 D.相互关系的密切程度 2.在相关分析中要求相关的两个变量A A.都是随机变量 B.自变量是随机变量 C.都不是随机变量 D.因变量是随机变量 3.下列现象之间的关系哪一个属于相关关系?A A.播种量与粮食收获量之间关系 B.圆半径与圆周长之间关系 C.圆半径与圆面积之间关系 D.单位产品成本与总成本之间关系 2 4.正相关的特点是C A.两个变量之间的变化方向相反 B.两个变量一增一减 C.两个变量之间的变化方向一致 D.两个变量一减一增 5.相关关系的主要特点是两个变量之间B A.存在着确定的依存关系 B.存在着不完全确定的关系 C.存在着严重的依存关系 D.存在着严格的对应关系 6.当自变量变化时, 因变量也相应地随之等量变化,则两个变量 之间存在着 A A.直线相关关系 B.负相关关系 C.曲线相关关系 D.正相关关系 7.当变量X值增加时,变量Y值都随之下降,则变量X和Y之间存 在着C A.正相关关系 B.直线相关关系 C.负相关关系 D.曲线相关关系 8.当变量X值增加时,变量Y值都随之增加,则变量X和Y之间存 在着D A.直线相关关系 B.负相关关系 C.曲线相关关系 D.正相关关系 9.判定现象之间相关关系密切程度的最主要方法是B A. 对现象进行定性分析 B.计算相关系数 C.编制相关表 D.绘制相关图 10.相关分析对资料的要求是D A. 自变量不是随机的,因变量是随机的 B.两个变量均不是随机的 C.自变量是随机的,因变量不是随机的 D.两个变量均为随机的 11.相关系数B A.既适用于直线相关,又适用于曲线相关 B.只适用于直线相关 C.既不适用于直线相关,又不适用于曲线相关 D.只适用于曲线相关 12.两个变量之间的相关关系称为A A.单相关 B.复相关 C.不相关 D.负相关 13.相关系数的取值范围是A A.-1≤r≤1 B.-1≤r≤0 C.0≤r≤1 D. r=0 14.两变量之间相关程度越强,则相关系数A A.愈趋近于1 B.愈趋近于0 C.愈大于1 D.愈小于1 15.两变量之间相关程度越弱,则相关系数B A.愈趋近于1 B.愈趋近于0 C.愈大于1 D.愈小于1 16.相关系数越接近于-1,表明两变量间C A.没有相关关系 B.有曲线相关关系 C.负相关关系越强 D.负相关关系越弱 17.当相关系数r=0时,D A. 现象之间完全无关 B.相关程度较小 C.现象之间完全相关 D.无直线相关关系 18.假设产品产量与产品单位成本之间的相关系数为-0.89,则说 明这两个变量之间存在A A.高度相关 B.中度相关 C.低度相关 D.显著相关 19.从变量之间相关的方向看可分为A A.正相关与负相关 B.直线相关和曲线相关 C.单相关与复相关 D.完全相关和无相关 20.从变量之间相关的表现形式看可分为B A.正相关与负相关 B.直线相关和曲线相关

