第四章假设检验
参数估计与假设检验的关系:参数估计和假设检验是推断统计方法的两个重要组成部分。 共同点:都是利用样本信息对总体数量特征进行推断。 不同点:推断的角度不同 4.1 假设检验的基本问题
1、假设检验——是指先对总体的参数或分布形式提出某种假设,然后利用样本信息判断假设是否成立的过程;
包括参数检验和非参数检验;逻辑上运用的是概率反证法;统计依据为小概率原理。
2、小概率事件——若事件A发生的概率P(A)很小很小或接近于0。一般在假设检验中,通常要求P(A)≤0.05。
3、原假设——又称零假设,是指研究者想收集证据予以反对的假设,表示为 H0。总是有符号 ?、? 或??
备择假设——也称研究假设,是指研究者想收集证据予以支持的假设,表示为 H1。总是有符号 ?、? 或 ?
4、原假设和备择假设是一个完备事件组,而且相互对立。在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立; 先确定备择假设,再确定原假设。因为备择假设大多是人们关心并想予以支持和证实的,一般比较清楚和容易确定;
等号“=”总是放在原假设上;
因研究目的不同,对同一问题可能提出不同的假设,也可能得出不同的结论。 假设检验主要是搜集证据来推翻和拒绝原假设。
5、双侧检验——是指备择假设没有特定的方向性,并含有符号?的假设检验,又称为双尾检验。
单侧检验——是指备择假设具有特定的方向性,并含有符号>或<的假设检验,又称为单尾检验。
备择假设的方向为<,称为左侧检验 备择假设的方向为>,称为右侧检验 单侧检验 假设 双侧检验 左侧检验 右侧检验 原假设 H0 : m = m0 H0 : m ? m0 H0 : m ? m0 备择假设 H1 : m ≠m0 H1 : m < m0 H1 : m > m0 6、 第Ⅰ类错误(弃真错误)
原假设为真时拒绝原假设。 第Ⅰ类错误的概率记为α,又被称为显著性水平。 又称为显著性水平,常被用于检验结论的可靠性度量;
既是一个概率值;又是抽样分布拒绝域面积的大小(表示犯第Ⅰ类错误概率的最大允许值); 常用的 ??值有0.01,0.05,0.10; 由研究者事先确定。 第Ⅱ类错误(取伪错误)
原假设为假时未拒绝原假设。 第Ⅱ类错误的概率记为β。
确定了显著性水平??就等于控制了第Ⅰ类错误的概率,但犯第Ⅱ类错误概率?的具体数值却很难确定,其受影响因素包括: 随假设总体参数的减少而增大;
当 ? 减少时增大;当 ? 增大时增大;当 n 减少时增大。
7、检验统计量——是指根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量。
标准化的检验统计量可表示为:标准化检验统计量?点估计量?假设值
点估计量的抽样标准差8、拒绝域——是指能够拒绝原假设的统计量的所有可能取值构成的集合。 大小等于显著性水平??。
位置取决于检验是单侧还是双侧。双侧拒绝域在分布两侧;单侧拒绝域在左侧或右侧。 临界值——根据给定的显著性水平确定的拒绝域的边界值。 9、决策步骤
①给定显著性水平?,查表得出相应的临界值z?或z?/2, t?或t?/2 ②将计算出的检验统计量的值与临界值比较 ③作出决策
双侧检验:|统计量| > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0 10、利用p值进行决策
p值——又称为观察到的显著性水平,在原假设为真的条件下,所得到的样本结果会像实际观测结果那么极端或更极端的概率。
α是指原假设正确时被拒绝的概率,或拒绝原假设犯错误的最大允许值;
p值与原假设的对或错的概率无关,它是关于数据的概率。如果原假设正确,p值表示这样的观测数据会有多么的不可能得到。或是犯错误的实际概率。 不论是单侧检验还是双侧检验,用p值进行决策的规则: 若p值,拒绝 H0 若p值>?,不拒绝 H0
p值反映实际观测到的数据与原假设H0之间不一致的程度的一个概率值。
p值越小,说明实际观测到的数据与原假设H0之间不一致的程度就越大,检验的结果也就越显著。
11、假设检验步骤
(1)、提出原假设和备择假设;
(2)、确定一个适当的检验统计量,并利用样本数据算出其具体数值; (3)、根据显著性水平,计算出其临界值,指定拒绝域; (4)、将统计量的值与临界值进行比较,作出决策。
统计量的值落在拒绝域,拒绝H0,否则不拒绝H0 也可以直接利用p值作出决策 4.2 一个正态总体的检验 一、总体均值的检验 1、总体方差已知的检验
当总体方差已知的情况,无论样本是大样本,还是小样本时,都使用z检验统计量。
z?x??0~N(0,1)
?n【例1】某厂生产铜丝,其主要质量指标为折断力X,根据历史资料统计,可假定X~N(570,82)。今新换材料生产,抽取30个样本值为:
577、578、579、569、565、577、568、587、 578、572、570、568、572、581、582、569、 570、570、572、596、584,598、588、563、 577、587、567、587
欲检验新材料生产的铜丝的折断力X有无明显变化。假定方差σ2 = 8 2保持不变,α=0.05
【解】此题为正态总体均值的假设检验 H0: μ= 570 H1:μ≠570
由于铜丝折断力X为大样本且总体方差已知,故可以采用Z检验法。依题意,样本均值
x577?578?...?567?587?为:x???538.4
n30x??538.4?570?31.6???21.64 1.46830检验统计量Z?0?n?α=0.05,查表得Zα/2=1.96
检验统计量|Z|=21.64>Zα/2=1.96
所以应拒绝H0,表明新材料生产的铜丝的折断力X有明显的变化。
【练习1】完成生产线上某件工作所需的平均时间不少于15.5分钟,标准差为3分钟,对随机抽选的36名职工讲授一种新方法,训练期结束后这36名职工完成此项工作所需的平均时间为13.5分钟,这个结果是否提供了充分证据,说明用新方法所需的时间短?设α=0.05,并假定完成这件工作的时间服从正态分布。 解:H0:μ≥15.5 H1:μ<15.5
由于大样本且总体方差已知,故采用Z检验法。依题意已知:??3 n?36 x?13.5 检验统计量 Z?x??0?n?13.5?15.5??4
336α=0.05,临界值Zα=1.645
Z=-4<-Zα=-1.645,所以拒绝原假设H0,表明有充分的证据说明用新方法所需的时间更短。 总体方差已知,检验方法的总结 假设 双侧检验 H0 : m =m0 H1 : m ?m0 左侧检验 H0 : m ?m0 H1 : m
总体服从正态分布,但总体方差未知时,样本容量的大小决定了所用的检验统计量, 大样本 z?x??0x??0~N(0,1) 小样本 t?~t(n?1) snsn【例2】某车床加工一种零件,要求其长度为150mm,现从一批加工后的这种零件中随机
抽取9个,测得其长度为:
147、150、149、154、152、153、148、151、155
如果零件长度服从正态分布,问这批零件是否合格?(α=0.05) 【解】所要检验的假设为:H0:μ=150 H1:μ≠150
根据题中数据,计算样本均值和样本标准差分别为:x?151,s?2.739 又知n=9<30,属于小样本,故应采用t检验法t?当α=0.05时,查表得 因为:|t|?1.095?x??S0n?151?150?1.095
2.7399t??n?1??2.306
2t??n?1??2.306
2所以不拒绝原假设H0,可以认为该批零件是合格的。
【练习3】某公司年度报表指出其应收账款的平均计算误差不超过50元,审计师从该公司年度应收账款账户中随机抽取16笔进行调查,测得应收账款的平均计算误差为56元,标准差为8元。假定应收账款的平均计算误差服从正态分布。问:当检验水平α=0.01时,该公司应收账款的平均计算误差是否超过50元? 解:所要检验的假设为:H0:μ≤50 H1: μ>50 依题意:x?56,s?8
又知总体服从正态分布,总体方差σ2未知,且n=16<30属于小样本,故采用t检验法。 检验统计量 t?x??S0n?56?50?3
816当α=0.01时,查t分布表得 因为:t?3?t??n?1??t?16?1??2.6025
0.01t??n?1??2.6025
所以应拒绝H0,可以认为该公司应收账款的平均计算误差超过50元。
【练习4】某番茄罐头中,维生素C的含量X服从正态分布,按规定标准,维生素C的含量不得少于21mg。现从一批罐头中随机抽取49罐,测得样本均值为23mg,样本标准差为3.98,试问该批罐头中维生素C的含量是否合乎标准?(α=0.05)
【解】此题属于正态总体、总体方差未知且大样本(n=49>30),故采用Z检验法。 所要检验的假设为:H0:μ≥21 H1:μ<21

