
高中数学复习专题51 统计(原卷版).docx
24页专题51 统计 【考点预测】知识点一、抽样1、抽样调查(1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体.(2)个体:构成总体的每一个元素叫做个体.(3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样本中个体的数目叫做样本容量.2、简单随机抽样(1)定义一般地,设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.(2)两种常用的简单随机抽样方法①抽签法:一般地,抽签法就是把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取次,就得到一个容量为的样本.②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随机数表由数字,,,…,组成,并且每个数字在表中各个位置出现的机会都是一样的.注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置.(3)抽签法与随机数法的适用情况抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况,但是当总体容量很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便.(4)简单随机抽样的特征①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平.只有四个特点都满足的抽样才是简单随机抽样.3、分层抽样(1)定义一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.分层抽样适用于已知总体是由差异明显的几部分组成的.(2)分层抽样问题类型及解题思路①求某层应抽个体数量:按该层所占总体的比例计算.②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比==”注意:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取()个个体(其中是层数,是抽取的样本容量,是第层中个体的个数,是总体容量).知识点二、用样本估计总体1、频率分布直方图(1)频率、频数、样本容量的计算方法①×组距=频率.②=频率,=样本容量,样本容量×频率=频数.③频率分布直方图中各个小方形的面积总和等于 .2、频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.3、百分位数(1)定义一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.(2)计算一组个数据的的第百分位数的步骤①按从小到大排列原始数据.②计算.③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.(3)四分位数我们之前学过的中位数,相当于是第百分位数.在实际应用中,除了中位数外,常用的分位数还有第百分位数,第百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.4、样本的数字特征(1)众数、中位数、平均数①众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.②中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.③平均数:个样本数据的平均数为,反应一组数据的平均水平,公式变形:.5、标准差和方差(1)定义①标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差.②方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.(2)数据特征标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.(3)平均数、方差的性质如果数据的平均数为,方差为,那么①一组新数据的平均数为,方差是.②一组新数据的平均数为,方差是.③一组新数据的平均数为,方差是.【题型归纳目录】题型一:随机抽样、分层抽样题型二:频率分布直方图、条形统计图、折线统计图、扇形统计图题型三:百分位数题型四:样本的数字特征【典例例题】题型一:随机抽样、分层抽样例1.(2022·全国·高三专题练习)某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,……,699,700.从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是( )3221183429 7864540732 5242064438 1223435677 35789056428442125331 3457860736 2530073286 2345788907 23689608043256780843 6789535577 3489948375 2253557832 4577892345A.623 B.328 C.253 D.007例2.(2022·全国·高三专题练习)有甲、乙两箱篮球,其中甲箱27个,乙箱9个,现从这两箱篮球中随机抽取4个,甲箱抽3个,乙箱抽1个.下列说法不正确的是( )A.总体是36个篮球 B.样本是4个篮球C.样本容量是4 D.每个篮球被抽到的可能性不同例3.(2022·上海宝山·高三阶段练习)某个年级有男生180人,女生160人,用分层抽样的方法从该年级全体学生中抽取一个容量为68的样本,则此样本中女生人数为( )A.40 B.36 C.34 D.32变式1.(2022·江西·赣源中学高三阶段练习(文))年月日,搭载问天实验舱的长征五号遥三运载火箭,在我国文昌航天发射场成功发射,我国的航天事业又上了一个新的台阶.某校现有高一学生人,高二学生人,高三学生人,为了调查该校学生对我国航天事业的了解程度,现从三个年级中采用分层抽样的方式抽取人填写问卷调查,则高三年级有多少人被抽中( )A.16 B.18 C.20 D.24变式2.(2022·四川省内江市第六中学模拟预测(理))某高中为了了解本校学生考入大学一年后的学习情况,对本校上一年考入大学的同学进行了调查,根据学生所属的专业类型,制成饼图,现从这些同学中抽出100人进行进一步调查,已知张三为理学专业,李四为工学专业,则下列说法不正确的是( )A.若按专业类型进行分层抽样,则张三被抽到的可能性比李四大B.若按专业类型进行分层抽样,则理学专业和工学专业应抽取30人和20人C.采用分层抽样比简单随机抽样更合理D.该问题中的样本容量为100变式3.(2022·上海静安·二模)2022年2月4日至2月20日春节期间,第24届冬奥会在北京市和张家口市联合举行.共有个冬奥村供运动员和代表队官员入住,其中北京冬奥村的容量约为人,延庆冬奥村的容量约人,张家口冬奥村的容量约人.为了解各冬奥村服务质量,现共准备了份调查问卷,采用分层抽样的方法,则需在延庆冬奥村投放的问卷数量是( )A.58份 B.50份 C.32份 D.19份变式4.(2022·全国·高三专题练习)利用简单随机抽样的方法,从个个体中抽取13个个体,若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为___________.变式5.(2022·重庆南开中学高三阶段练习)某中学为了掌握学校员工身体状况,偶尔会采用抽检的方式来收集各部门员工的健康情况.为了让样本更具有代表性,学校对各部门采用分层抽样的方法进行抽检.已知该校部门、部门、部门分别有40、60、80人,各部门员工不存在交叉任职情况,若共抽检了90人,则部门抽检人数为______.变式6.(2022·全国·高三专题练习)某市甲、乙、丙三所学校的高三学生共有800名,其中男、女生人数如下表:甲校乙校丙校男生9790x女生153160y(1)现用分层随机抽样的方法从这三所学校的所有高三学生中抽取48人,则应从丙校抽取多少人?(2)该市模考后,市教研室准备从这三所学校的所有高三学生中利用随机数法抽取100人进行成绩统计分析,将800人按001,002,…,800进行编号,如果从第8行第7列的数开始向右读,请你依次写出最先抽取的4个人的编号.(下面摘取了随机数表第7行至第9行)8442 1753 3157 2455 0688 7704 7447 6721 7633 5026 83926301 5316 5916 9275 3816 5821 7071 7512 8673 5807 44391326 3321 1342 7864 1607 8252 0744 3815 0324 4299 7931【方法技巧与总结】不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.题型二:频率分布直方图、条形统计图、折线统计图、扇形统计图例4.(2022·辽宁朝阳·高三阶段练习)某市教育局为得到高三年级学生身高的数据,对高三年级学生进行抽样调查,随机抽取了名学生,他们的身高都在,,,,五个层次内,分男、女生统计得到以下样本分布统计图,则( )A.样本中层次的女生比相应层次的男生人数多B.估计样本中男生身高的中位数比女生身高的中位数大C.层次的女生和层次的男生在整个样本中频率相等D.样本中层次的学生数和层次的学生数一样多例5.(2022·黑龙江·佳木斯一中三模(理))如图1为某省2019年1~4月份快递业务量统计图,图2为该省2019年1~4月份快递业务收入统计图,对统计图理解不正确的是( )A.2019年1~4月份快递业务量3月份最高,2月份最低,差值接近2000万件B.从1~4月份来看,业务量与业务收入有波动,但整体保持高速增长C.从两图中看,增量与增长速度并不完全一致,但业务量与业务收入变化高度一致D.2019年1~4月份快递业务量同比增长率均超过50%,在3月份最高,和春节后网购迎来喷涨有关例6.(2022·湖北孝感·高三阶段练习)2021年7月至2022年7月,我国居民消费价格保持平稳,居民消费价格涨跌幅如图所示,则( )备注:同比增长率=,环比增长率=,A.2022年1月全国居民消费价格比2021年1月全国居民消费价格有所下降B.2022年5月全国居民消费价格比2022年4月全国居民消费价格有所上升。












