2、从某罐头厂仓库采用纯随机不重复抽样从10000瓶抽取100瓶罐头,平均
每罐重量为243克,样本标准差为10克。以90%的可靠程度估计该批罐头平均每罐重量的区间范围。(Z0.05?1.645)
2、由于总体方差未知,但是大样本,可以用样本方差S代替。
n?100,x?243,s?10,Z0.05?1.645x?Z?/2?sn
?243?1.645?10100?241.36
x?Z?/2?sn?243?1.645?10100?244.65
则,以90%的可靠程度估计该批罐头平均每罐重量的区间范围为(241.36,244.65) 3、由统计资料得知,2008年某地新生儿的平均体重为3190克,现在从2009年的新生儿中随机抽取100个,测得其平均体重为3210克,问2009年的新生儿与2008年相比,体重有无显著差异?(假设新生儿体重的标准差为80克,显著性水平为0.05,Z0.025?1.96)
3、解:首先提出原假设和备选假设:
H0?3190
H1?3190
2
因为总体方差?已知,且是大样本,所以采用Z统计量:
Z?X?u0?/n。
Z0.025?1.96x?3210,??80,n?100由于,,
代入Z得:
5
Z?X?u0?/n?3210?319080/100?2.5
因为Z大于Z0.025
所以,拒绝原假设,接受原假设。
即认为2009年的新生儿与2008年相比,体重有显著差异。
??10?0.5x4、根据一组数据建立的线性回归方程y?.要求:
?的意义。 1)解释斜率?12)当x=6时的E(y) 4、 1)斜率
??1的意义在于:自变量X变化对Y影响程度。回归方程中,当x增加
一个单位时,y将减少0.5个单位。
2)x=6时,代入方程,则,y=10-0.5 ?6=7
5、若机床的使用年限和维修费用相关,有如下资料: x机床使用年限 y维修费用 1 10 2 14 3 18 4 20 5 25 6 28 7 30 8 40 要求:1)绘制散点图,并说明x与y之间是否大致呈线性关系?
2)建立回归方程并说明回归系数的经济意义
5、
1)散点图略。 x与y呈现线性关系。
6
2)设回归方程为则
????x?i??y01i
n??1?
?(xi?x)(yi?y)i?1n?3.86
?(xi?x)i?12???0?y??1x?5.7所以,线性回归方程为:y=5.7+3.86x.
由以上回归方程知道,机床每增加一年的使用时间,维修费约增加3.68个单位。 四、简答
1、简述参数最小二乘估计的基本原理。
2、一元线性回归模型中关于随机项的基本假定。 3、在回归分析中,F检验和t检验各有什么用? 4、相关分析和回归分析的区别与联系
四、简答
1、估计线性回归方程,即寻找一条最能拟合观测值的直线。假设该直线为:
????x?i??y01i
,若该直线上的点
?iy与真实观测值
yi的总误差最
7
小,即
Q???i)(yi?y2最小,那么,该直线就是最能拟合观测值的回
归直线。 2、
1)随机项的数学期望为0,即
E(ui)?02,
2)随机项的方差相同,即
var(ui)??
3)随机项
ui,uj不相关。即
cov(ui,uj)?0cov(ui,xj)?0
4)随机项与自变量独立无关。即
3、t检验用来检验方程中变量系数的显著性,t值大于临界值时,认为系数显著
地不为0,则说明自变量对因变量的影响显著。
F检验用来检验方程的线性显著性。F值大于临界值时,则说明方程的线性关系显著。
4、1)联系:相关分析是回归分析的前提,回归分析是建立在相关分析基础之上的。
2)区别:a,相关分析中,两个变量都是随机变量,不必区分自变量和因变量; 回归分析研究的是一个随机变量Y与另一个非随机变量X之间的关系,且变量之间必须区分自变量和因变量。
b,相关系数只能观察变量之间的相关关系的密切程度和方向。而回归分析可以根据回归方程,用自变量数值推算因变量的估计值。
8

