10. 相关与回归分析

2026/4/23 5:34:58

101 10 相关与回归分析

Estimation(曲线估计)命令,可以自动完成11种曲线的拟合。

这11种模型是:Linear(线性模型,y=b0+b1x)、Quadratic(二次模型,y= b0+b1x+b2x2)、Compound(复合模型,y=b0(b1)x)、Growth(生长模型,y=eb0+b1x)、Logarithmic(对数模型,y=b0+b1lnx)、Cubic(三次模型,y= b0+b1x+b2x2+b3x3)、S(S型模型,y= eb0+b1/x)、Exponential(指数模型,y=b0eb1x)、Inverse(逆模型,y= b0+b1/x)、Power(幂模型,y=b0xb1)、Logistic(Logistic模型,y=1/(1/u+b0(b1)x)。这些曲线拟合其本质都是先进行曲线直线化,然后进行线性模型拟合,最后将模型表达式转换回原始变量的表达方式。

进行曲线估计时,可以选择多种拟合模式,进行比较后选择较好者。

例10-7 某单位钩虫病病人重复治疗次数与阳性率的资料见表10-4。试作曲线拟合。

表10-4 钩虫病病人数据

次数x

1

2 36

3

4

5 7.3

6 4.5

7 2.8

8 1.7

阳性率y 63.9 17.1 10.5

解:以x、y为变量名,将表10-4中数据建立成8行2列的数据文件。作散点图,显示x、y近似呈指数关系。

选择菜单Analyze→Regression→Curve Estimation(曲线估计),弹出如图10-19所示Curve Estimation对话框,将因变量y送入Dependent(因变量)框中,自变量x送入Independent(自变量)框中的Variable(变量)框中;去掉Linear(线性)选项,选中Exponential(指数);选中下面的Display ANOVA table;单击OK。

曲线估计 因变量: y 自变量 ⊙变量 x ○时间 观测标签 确定 粘贴 重置 取消 帮助 ?方程中含常数 ?显示模型曲线图 模型 □线性 □二次 □复合 □生长 □对数 □三次 □S型 ?指数 □逆型 □幂型 □Logistic ?显示方差分析表 保存 图10-19 Curve Estimation对话框

单击图10-19对话框中Save按钮,可以选择保存预测值、残差、预测区间等。

输出结果的格式和线性回归相仿。决定系数R2=0.993,方差分析,F=807.151,P=0.000,回归方程有统计学意义。由图10-20,按指数模型的函数格式 y=b0eb1x 可以得回归方程

??92.393e?0.506x。用鼠标右键单击图10-19对话框中Models下的模型名称,在弹出的快捷y帮助框中就显示有该模型的函数格式。

本例还输出了按指数模型拟合的曲线图(略),从曲线图中可以看出拟合效果很好。

SPSS统计软件 102

CoefficientsUnstandardizedCoefficientsBStd. Errorx-.506.018(Constant)92.3938.314The dependent variable is ln(y).StandardizedCoefficientsBeta-.996t-28.41011.113Sig..000.000 图10-19 例10-7回归方程的参数估计 10.7 非线性回归

上一节介绍的曲线拟合处理的是比较简单的曲线关系,先进行变量变换,将曲线关系转换为直线关系,从而利用线性过程进行分析拟合,最后再将模型表达式转换回原始变量的表达方式,这样保证了变换后变量的残差平方和最小,可是变换回原始变量时,不一定是最优方程。况且有的曲线关系很复杂,不可能通过变量变换转换为直线方程,此时不能使用线性回归。非线性回归就是为解决以上问题提出的一个通用模型框架,它采用迭代方法对用户设置的复杂曲线模型进行拟合。

在SPSS中,选择Analyze→Regression→Nonlinear(非线性回归)命令,可以完成非线性回归分析。常用非线性模型见表10-5,在模型的选择上一定要根据数据的性质而定,而且确定模型中参数的初始值非常重要,有时准确地选择了模型,但设置的初始值却不好,就有可能得不到一个较好的方程。

表10-5 常用非线性模型

名称

Asymptotic Regression Asymptotic Regression Density Gauss Gompertz

Johnson-Schumacher Log-Modified Log-Logistic

模型表达式

b1 + b2 * exp(b3 * x) b1 – (b2 * (b3 ** x)) (b1 + b2 * x) ** (–1 / b3) b1 * (1 – b3 * exp(–b2 * x ** 2)) b1 * exp(–b2 * exp(–b3 * x)) b1 * exp(–b2 / (x + b3)) (b1 + b3 * x) ** b2

b1 – ln(1 + b2 * exp(–b3 * x))

Metcherlich Law of Diminishing Returns b1 + b2 * exp(–b3 * x) Michaelis Menten Morgan-Mercer-Florin Peal-Reed Ratio of Cubics Ratio of Quadratics Richards Verhulst

b1 * x / (x + b2)

(b1 * b2 + b3 * x ** b4) / (b2 + x ** b4)

b1 / (1+ b2 * exp(–(b3 * x + b4 * x **2 + b5 * x ** 3))) (b1 + b2 * x + b3 * x ** 2 + b4 * x ** 3) / (b5 * x ** 3) (b1 + b2 * x + b3 * x ** 2) / (b4 * x ** 2) b1 / ((1 + b3 * exp(–b2 * x)) ** (1 / b4)) b1 / (1 + b3 * exp(–b2 * x))

Von Bertalanffy Weibull Yield Density

103 10 相关与回归分析

(b1 ** (1 – b4) – b2 * exp(–b3 * x)) ** (1 / (1 – b4)) b1 – b2 * exp(–b3 * x ** b4) (b1 + b2 * x + b3 * x ** 2) ** (–1)

例10-8 对例10-7中数据进行非线性回归分析。

解:数据文件同例10-7。首先确定初始值,本例是指数模型y=aebx,由原始数据中任选两个点,如(3,17.1)和(6,4.5),代入y=aebx,得到关于a、b的方程组17.1=ae3b,4.5=ae6b,解得a=64.98、b=-0.45。

选择菜单Analyze→Regression→Nonlinear(非线性回归),弹出如图10-20所示Nonlinear Regression主对话框,将因变量y送入Dependent(因变量)框中,在Model Expression(模型表达式)框中键入所选模型相应的函数表达式,本例键入a*EXP(b*x);

单击Parameters(参数)按钮,弹出Parameters对话框(见图10-21),设置a的初始值为64.98,b的初始值为-0.45,单击Continue,返回主对话框;单击OK。

用鼠标单击图10-20对话框中Save按钮,可以选择保存预测值、残差、预测区间等。

图10-20 Nonlinear Regression主对话框

ANOVAaSourceRegressionResidualUncorrected TotalCorrected TotalSum ofSquares5855.09711.0435866.1403281.335df2687Mean Squares2927.5481.841Dependent variable: ya. R squared = 1 - (Residual Sum of Squares)/ (Corrected Sum of Squares) = .997. 图10-21 Parameters对话框 图10-22 例10-8回归方程的方差分析

主要输出结果见图10-22、23,图10-22为非线性回归的方差分析,残差均方不是误差的无偏估计,所以通常的方差分析不能用于非线性回归的检验。可以根据决定系数R2的大小

SPSS统计软件 104

判断模型拟合的好坏。本例决定系数R2=0.997,拟合效果较好。

??115.722e图10-23给出参数估计,非线性回归方程为y??92.393e到的回归方程为y?0.506x?0.595x。上一节用曲线拟合得

,a、b两系数相差很大。在这两个题目的操作时,用鼠

标单击主对话框的Save按钮,可以选择保存预测值、残差,结果见图10-24,FIT_1和ERR_1

分别是曲线拟合模型的预测值和残差,PRED_和RESID分别是非线性回归模型的预测值和残差,比较两列残差得,非线性回归模型的拟合效果更好一些。

Parameter EstimatesStd.Error4.259.02295% Confidence IntervalLower BoundUpper Bound105.301126.143-.650-.540ParameterabEstimate115.722-.595

图10-23 例10-8回归方程的参数估计 图10-24 例10-8预测值和残差

本章小结

本章由浅入深介绍一元线性相关与回归、多元线性相关与回归、多元线性逐步回归、曲线拟合和非线性回归。要记住每个方法应该选择的菜单和相关的对话框的操作,要结合实例,边看书边操作,在分析解释计算结果时,特别要注意与专业知识的结合。

本章介绍的线性回归模型要求因变量是连续的正态分布变量,当因变量是分类变量时,线性回归模型的假设条件不成立了,这是,要用Logistic回归模型,它对因变量的分布没有要求。在下一章中将介绍Logistic回归分析。

习题10

习题10-1 研究中国林蛙在不同温度与心律之间的关系,数据见表10-6,试进行相关分析与回归分析。

表10-6 中国林蛙在不同温度下的心律

温度x 心率y

2 5

4

6

8

10 12 14 16 18

11 13 14 22 23 32 29 32

习题10-2 某血吸虫防治站调查10个乡的钉螺密度(只/平方米)与居民血吸虫感染率(%),数据见表10-7,问钉螺密度与居民血吸虫感染率是否有关?

表10-7 钉螺密度与居民血吸虫感染率

钉螺密度x 感染率y

33 52 22 42 35 49 31 39 45 43 17 24 13 27 19 23 18 18 24 20

习题10-3 27名糖尿病人的血清总胆固醇x1(mmol/L)、甘油三脂x2(mmol/L)、空腹胰岛素x3(?U/ml)、糖化血红蛋白x4(%)、空腹血糖y(mmol/L)的测量值列于表10-8

105 10 相关与回归分析

中,试①建立血糖与其它几项指标关系的多元线性回归方程;②用逐步回归法筛选自变量。

表10-8 糖尿病人的血糖及有关变量的含量

序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 x1 x2 x3 4.53 7.32 6.95 5.88 4.05 1.42 x4 6.9 y 序号 x1 6.13 5.71 6.40 6.06 5.09 6.13 5.78 5.43 6.50 7.98 x2 2.06 1.78 2.40 3.67 1.03 1.71 3.36 1.13 6.21 7.92 x3 10.35 8.53 4.53 12.79 2.53 5.28 2.96 4.31 3.47 3.37 1.20 8.61 6.45 x4 y 5.68 1.90 3.79 1.64 6.02 3.56 4.85 1.07 4.60 2.32 6.05 0.64 8.2 11.2 15 8.8 16 10.5 10.9 8.0 10.1 10.3 14.8 7.1 9.1 8.9 10.8 9.9 10.2 8.0 13.6 11.3 14.9 12.3 16.0 9.8 13.2 10.5 20.0 6.4 13.3 9.6 10.4 10.8 12.3 17 8.3 11.6 18 7.5 13.4 19 13.6 18.3 20 8.5 11.1 21 11.5 12.1 22 7.9 7.1 8.7 9.6 23 8.4 24 9.3 25 4.90 8.50 12.60 7.08 3.00 6.75 3.85 2.11 16.28 4.65 0.63 4.59 1.97 4.29 1.97 7.97 1.93 6.19 1.18 6.59 3.61 6.61 7.57 1.42 11.54 10.89 5.84 3.84 0.92 1.20 7.8 10.6 26 9.9 6.9 8.4 27 9.6 习题10-4 在蒙药无味甘露胶囊的提取工艺研究中,测得芦丁对照浓度与吸光度数据见表10-9,折线图呈幂函数回归y=axb曲线。试建立芦丁吸光度关于浓度的回归方程。

表10-9 蒙药无味甘露胶囊芦丁对照浓度与吸光度数据 浓度 0.212 0.424 0.199 0.636 0.293 0.848 0.400 1.060 0.508 1.720 0.615 吸光度 0.099 习题10-5 在石杉碱提取工艺研究中,资料见表10-10,折线图呈指数回归y=aebx曲线。试建立Hup-A浓度关于盐酸PH的回归方程。

表10-10 石杉碱提取工艺中Hup-A浓度与盐酸PH值测定 盐酸PH

1.0

1.5 19.4

2.0 20.1

2.5 21.3

3.0 23

3.5 25.7

Hup-A浓度 19.3

习题10-6 为研究大气对日光紫外线辐射的影响,在某晴天测得不同时间紫外线辐射

2

强度(0.01 NKMnO4ml/100cm·min)见表10-11。试建立回归方程。

表10-11 大气对日光紫外线辐射的影响研究

时间x 紫外线强度y

9 0.47

10 0.57

11 0.68

12 0.73

13 0.67

14 0.55

15 0.38


10. 相关与回归分析.doc 将本文的Word文档下载到电脑
搜索更多关于: 10. 相关与回归分析 的文档
相关推荐
相关阅读
× 游客快捷下载通道(下载后可以自由复制和排版)

下载本文档需要支付 10

支付方式:

开通VIP包月会员 特价:29元/月

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:xuecool-com QQ:370150219