2
分组区间 频数统计 上表对应的频率分布直方图为A.
(3)①由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3. ②区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6. 因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000. [答案] (1)D (2)A (3)①3 ②6 000 [类题通法]
(1)茎叶图与频率分布表的关系如下: 频率分布表中的分组
茎叶图的茎;
茎上叶的数目.
[0,5) [5,10) [10,15) [15,20) [20,25) [25,30) [30,35) [35,40] 1 1 4 2 4 3 3 2 频率分布表中指定区间组的频率(2)频率分布直方图中计算用到的知识:
频率①图中小矩形的面积=组距×=频率.
组距②所有小矩形的面积之和为1.
[题组训练]
1.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )
A.0.2 C.0.5
B.0.4 D.0.6
解析:选B 由茎叶图可知数据落在区间[22,30)内的频数为4,所以数据落在区间[22,30)4
内的频率为=0.4,故选B.
10
2.某地教育部门为了调查学生在数学考试中的有关信息,从上次参加考试的10 000名考生中用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如图所示),则这10 000人的数学成绩在[140,150](单位:分)段的约是________人.
3
2
解析:设500人的数学成绩在[140,150]段的人数为x,10 000人的数学成绩在[140,150]段的人数为n.由样本频率分布直方图知数学成绩在[140,150]段的频率是相应小矩形的面积,即0.008×10=0.08=
x11,∴x=40.又样本的个数占总体个数的,即每组的抽样比为,∴5002020
140
=,∴n=800,因此10 000人的数学成绩在[140,150]段的约是800人. 20n
答案:800
用样本的数字特征估计总体的数字特征 此类问题主要以选择题、填空题形式考查平均数、方差等数字特征的计算,有时与其他知识结合出现在解答题中.
[考点精要]
1.有关数据的数字特征
2.众数、中位数、平均数的异同
(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量. (2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会相应引起平均数的变动.
(3)众数考查各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,众数往往更能反映问题.
3
2
(4)中位数仅与数据的大小排列顺序有关,某些数据的变动可能对中位数没有影响,,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.
[典例] (1)重庆市2015年各月的平均气温(℃)数据的茎叶图如图,则这组数据的中位数是( )
A.19 C.21.5
B.20 D.23
(2)某工厂36名工人的年龄数据如下表. 工人 编号 1 2 3 4 5 6 7 8 9 ①用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据.
②计算①中样本的均值x和方差s2.
③36名工人中年龄在x-s与x+s之间有多少人?所占的百分比是多少(精确到0.01%)?
[解析] (1)由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所20+20以中位数为=20.
2
答案:B
(2)解:①36人分成9组,每组4人,其中第一组的工人年龄为44,所以它在组中的编
3
年龄 40 44 40 41 33 40 45 42 43 工人 编号 10 11 12 13 14 15 16 17 18 年龄 36 31 38 39 43 45 39 38 36 工人 编号 19 20 21 22 23 24 25 26 27 年龄 27 43 41 37 34 42 37 44 42 工人 编号 28 29 30 31 32 33 34 35 36 年龄 34 39 43 38 42 53 37 49 39 2
号为2,
所以所有样本数据的编号为4n-2(n=1,2,…,9), 其年龄数据为:44,40,36,43,36,37,44,43,37. ②由均值公式知:x=
44+40+…+37
=40,
9
1100
由方差公式知:s2=[(44-40)2+(40-40)2+…+(37-40)2]=. 9910010
③因为s2=,s=,
93
所以36名工人中年龄在x-s和x+s之间的人数等于年龄在区间[37,43]上的人数, 即40,40,41,…,39,共23人.
所以36名工人中年龄在x-s和x+s之间的人数所占的百分比为×100%≈63.89%.
[类题通法]
通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准差),呈现样本数据的集中趋势及波动大小,从而实现对总体的估计.
(1)一般情况下,需要将平均数和标准差结合,得到更多样本数据的信息,从而对总体作出较好的估计.因为平均数容易掩盖一些极端情况,使我们对总体作出片面的判断,而标准差较好地避免了极端情况.
(2)若两组数据的平均数差别很大,也可以仅比较平均数,估计总体的平均水平,从而作出判断.
[题组训练]
1.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( )
3
2336