2
复习课(一) 统 计
抽样方法的选取及应用
此类问题多以选择题、填空题的形式考查,有时与概率问题相结合以解答题的形式出现,难度偏小,属中、低档题.
[考点精要]
1.三种抽样方法
(1)简单随机抽样:是抽样中一个最基本的方法——逐一不放回地抽取.一次抽取所有样本和抽取样本检查后放回样本都不是简单随机抽样.
(2)系统抽样:按照简单随机抽样抽取第一个样本,然后按相同的间隔(即抽样距)抽取其他样本.
(3)分层抽样:将总体分成若干层,在各层中按照所占比例随机抽取一定的样本. 2.三种抽样方法的适用原则
(1)看总体是否由差异明显的几个层组成.若是,则选用分层抽样;否则,考虑用简单随机抽样或系统抽样.
(2)看总体容量和样本容量的大小.当总体容量较小时,采用抽签法;当总体容量较大、样本容量较小时,采用随机数表法;当总体容量较大、样本容量也较大时,采用系统抽样.
[典例] (1)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )
类别 老年教师 中年教师 青年教师 合计 A.90 C.180
B.100 D.300
人数 900 1 800 1 600 4 300 (2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.
?
14?1 1 1 2 2 2 3 3 4 4 5 5 5 6 6 7 8 15?0 1 2 2 3 3 3
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )
A.3 C.5
3
13
0 0 3 4 5 6 6 8 8 8 9
B.4 D.6
2
x320
[解析] (1)设样本中的老年教师人数为x,则=,解得x=180,选C.
1 600900(2)第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在[139,151]上恰有4组,故有4人,选B.
[答案] (1)C (2)B [类题通法]
(1)分层抽样中容量的计算
分层抽样的特点是“按比例抽样”,即 每层中抽取的个体数样本容量
=. 该层的个体数总体容量(2)系统抽样中个体编号的确定
系统抽样的特点是“等距抽样”,即第一段抽取的是编号为i的个体,则第k段抽取的是第k段中的第i个.
(3)当总体容量或其中某层中的个体数使得不能恰好按比例或等距抽取时,应该采取简单随机抽样的方法剔除若干个体后再进行.
[题组训练]
1.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )
A.抽签法 C.分层抽样法
B.系统抽样法 D.随机数法
解析:选C 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法. 2.有20位同学,编号从1至20,现在从中抽取4人做问卷调查,用系统抽样的方法确定所抽的编号可能为( )
A.3,8,13,18 C.2,4,6,8
B.2,6,10,14 D.5,8,11,14
20
解析:选A 总体个体数是20,样本容量为4,因此分段间隔k==5,只有选项A
4中的数据的分段间隔为5.
3.某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从
3
2
该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.
x45
解析:设男生抽取x人,则有=,
900900-400解得x=25. 答案:25
4.某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按样本,则应抽取高一学生数为________.
xxxx
解析:若设高三学生数为x,则高一学生数为,高二学生数为+300,所以有x++2222800
+300=3 500,解得x=1 600.故高一学生数为800,因此应抽取高一学生数为=8.
100
答案:8
用样本的频率分布估计总体分布 此类问题多以选择题、填空题的形式考查频率分布直方图、茎叶图等,属中、低档题.有时与概率等知识相结合以解答题的形式出现.
[考点精要]
1.频率分布直方图
1
的抽样比用分层抽样的方法抽取100
2.茎叶图
[典例] (1)对一批产品的长度(单位:毫米)进行抽样检测,如图为检测结果的频率分布直方图.根据标准, 产品长度在区间[20,25)上为一等品,在区间[15,20)和[25,30)上为二等品,在区间[10,15)和[30,35]上为三等品.用频率估计概率,现从该批产品中随机抽取1件,则其为二等品的概率是( )
3
2
A.0.09 C.0.25
B.0.20 D.0.45
(2)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )
(3)某电子商务公司对10 000名网络购物者2015年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
①直方图中的a=________;
②在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. [解析] (1)由频率分布直方图的性质可知,样本数据在区间[25,30)上的频率为1-5×(0.02+0.04+0.06+0.03)=0.25,则二等品的频率为0.25+0.04×5=0.45,故任取1件为二等品的概率为0.45.
(2)由茎叶图知,各组频数统计如下表:
3