好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

2021中级经济师《经济基础知识》考点解析-第四部分统计.pdf

42页
  • 卖家[上传人]:夏**
  • 文档编号:577243988
  • 上传时间:2024-08-21
  • 文档格式:PDF
  • 文档大小:7.33MB
  • / 42 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 本章考情年份单选题多选题合计2 0 2 0 年4 题 4分3 题 6 分1 0 分2 0 1 9 年3 题 3分1 题 2 分5分2 0 1 8 年3题 3分1 题 2 分5分本章重点:1 . 统计学、描述统计与推断统计的含义2 . 变量、数据,定性变量和定量变量,分类数据、顺序数据和数值型数据3 . 观测数据和实验数据,一手数据和二手数据4 . 统计调查的含义及其分类( 全面调查和非全面调查、连续调查和不连续调查),常用统计调查方式 ( 统计报表、普查、抽样调查、重点调查和典型调查)的含义、特点和应用场合5 . 数据科学与大数据知识点一:统计学( - )统计学:一门关于数据的学科,它提供了一系列用于收集、处理、分析和解释数据的方法 -)统计学两个分支:L描述统计:研究数据收集、整理和描述的统计学方法主要内容:如何取得所需要的数据,如何用图表或数学方法对数据进行整理和展示,如何描述数据的一般性特征 示例】利用统计图表展示G D P 的变化、利用增长率描述人均可支配收入的基本走势、利用统计表描述公司员工年龄分布等2 . 推断统计:研究如何利用样本数据来推断总体特征的方法 _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _参数估 利用样本信息推断总体特征某国家男青年的身高构成一个总体,想知道这个总体的均值,随机抽取部分人,测得身高的均值,再用这些数据来估计这群人的平均身高述假设检 利用样本信息判断对总体的假设是否成立若假设“ 该国男青年平均身高超过1 . 7 米”,需要通过样本检验验此命题是否成立【 例 题 •单选题】 ( 2 0 2 0 年)下列统计处理中,属于描述统计的是( )。

      A . 利用均值测度一组数据的集中趋势B . 利用抽样调查数据推断城镇居民平均收入C . 利用样本信息推断消费者对某品牌的知晓度D . 利用最小二乘法拟合线性回归模型『 正确答案』A『 答案解析』 描述统计是研究数据收集、整理和描述的统计学方法其内容包括如何取得所需要的数据,如何用图表或数学方法对数据进行整理和展示,如何描述数据的一般性特征选项B C D 属于推断统计 例 题 • 单选题】利用概率样本数据推断全国居民人均消费支出,适用的统计学方法是( )A . 参数估计B . 相关分析C . 假设检验D . 描述统计『 正确答案』A『 答案解析』本题考查统计学参数估计是利用样本信息推断总体特征 知识点二:变量和数据( 一)变量1 . 变量:研究对象的属性或特征,它是相对于常数而言的常数只有一个固定取值,而变量可以有两个或更多个可能的取值 示例】性别、受教育水平、年收入等2 . 分类:定量变重( 数量变量)变量的取值是数量职工人数、年销售额等定性变量分类变重变量的取值为类别性别、出行方式、工作行业等顺序变量变量的取值表现为类别且具有一定顺序客户满意度、经济师职称等( 二)数据1 . 含义:对变量进行测量、观测的结果。

      数据根据需要可以是数值、文字或者图像等形式2 . 分类分类数据分类变量的观测结果表现为类别,一般用文字来表述,也可用数值代码表示, , 性别”=" 男 ”, “ 女”= "0” , “ 1 ”顺序数据顺序变量的观测结果也表现为类别,一般用文字来表述,也可用数值代码表示“ 客户满意度”=" 非常满意”, “ 满意”, “ 不满意”=“ ]” , “ 2 " , " 3 ”数值型数 定量变量的观测结果表现为具体表示大小或多少的数值“ 年龄”f i=“ 2 0 ” , “ 3 0 ” , “ 4 0 ”3 . 对不同类型的数据,可采用不同的统计方法来处理和分析 1 )分类数据:计算出各类别的频 率 , 但对其进行加、减、乘或除等数学运算是没有意义的 2 )数值型数据:可以进行数学运算,计算均值和方差等统计量 例 题 •单选题】 ( 2 0 2 0 年)对顺序变量观测的结果称为( )A . 顺序数据B . 定量数据C . 分类数据D . 数值型数据『 正确答案』A『 答案解析』数据是对变量进行测量、观测的结果顺序数据是对顺序变量的观测结果 例 题 • 单选题】下列变量中,属于分类变量的是( )。

      A . 运输方式B . 公共预算收入C . 商品零售额D . 新增就业人数『 正确答案』A『 答案解析』本题考查变量和数据当变量的取值表现为类别时则被称为分类变量,比如企业所属行业 例 题 • 多选题】分类数据和顺序数据的共同点是( ) A . 可用数值代码表示B . 表现为类别C . 通常用文字表述D . 有顺序E . 不区分顺序『 正确答案』A B C『 答案解析』本题考查分类数据和顺序数据二者都表现为类别,都可以用文字表述,也都可以用数值代码表示知识点三:数据的来源( 一)按收集方法分类:观测数据和实验数据1 . 观测数据: 通过直接调查或测量而收集到的数据, 是在没有对事物施加任何人为控制因素的条件下得到的,几乎所有与社会经济现象有关的统计数据都是观测数据 示例】G D P 、C P I 、房价等2 . 实验数据: 通过在实验中控制实验对象以及其所处的实验环境收集到的数据自然科学领域的数据大多都是实验数据 示例】一种新产品使用寿命的数据等 二)统计数据按来源分为:1 . 一手数据:来源于直接的调查和科学实验的数据,对使用者来说这是数据的直接来源来源主要有:调查或观察、实验。

      2 . 二手数据:来源于别人的调查或实验的数据,对使用者来说这是数据的间接来源来源主要有:统计年鉴、内部财务报表等 例 题 •单选题】 ( 2 0 2 0 年)下列统计数据中,属于观测数据的是( )A . 居民收入数据B . 新药疗效数据C . 电池使用寿命数据D . 轮胎使用寿命数据『 正确答案』A『 答案解析』通过直接调查或测量而收集到的数据,称为观测数据观测数据是在没有对事物施加任何人为控制因素的条件下得到的, 几乎所有与社会经济现象有关的统计数据都是观测数据 选项B C D 属于实验数据 例 题 • 单选题】通过直接统计调查获得的数据属于( )A . 二手数据B . 实验数据C . 间接数据D . 一手数据『 正确答案』D『 答案解析』本题考查数据的来源统计数据,就其本身的来源来看,最初都来源于调查或实验但从使用者的角度看,数据的来源主要有两种:一是直接的调查和科学实验,对使用者来说,这是数据的直接来源,称为直接数据或一手数据;二是别人的调查或实验的数据,对使用者来说,这是数据的间接来源,称为间接数据或二手数据一手数据的来源主要有两个:一是调查或观察,二是实验在社会经济领域,统计调查是获得数据的主要方法,也是获得一手数据的重要方式。

      知识点四:统计调查 (-)统计调查的概念与分类1 . 统计调查:按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地收集数据信息资料的过程调查过程有两个重要特征:( 1 ) 调查是一种有计划、有方法、有程序的活动;( 2 ) 调查的结果表现为搜集到的数据2 . 分类( 1 ) 按调查对象的范围不同全面调查:对构成调查对象的所有单位进行逐一的、无一遗漏的调查,包括全面统计报表和普查例如,人口普查、经济普查等非全面调查:对调查对象中的一部分单位进行调查,包括非全面统计报表、抽样调查、重点调查和典型调查等例如,城市居民家庭的生活水平等 2 ) 按登记的电㈣是否连续_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _连续调查J 为观察总体现象在一定时期内( 通常是一年内) 的数量变化,要求随着调查对象的发展变化,连续地进行调查登记,说明现象的发展过程V 目的是了解现象在一段时期的总量产品产量能源的消耗等不连续调查7间隔一个相当长的时间( 通常是一年以上) 所作的调查。

      数值在短期内变化不大,不需要连续登记为了对总体现象在一定时点上的状态进行研究生产设备拥有量耕地面积等( 二 ) 统计调查的方式统计报表、普查、抽样调查、重点调查、典型调查调查方式含义分类/ 特征统计报表按照国家有关法规的规定, 以一定的原始数据为基础, 自上而下地1. 按调查对象范围的不同分为:全面统计报表和非全面统计报表目前的大多数统计报表都是全面统计报表2 . 按报送周期长短的不同分为:日报、月报、季报、年报等3. 按报表内容和实施范围的不同分为:国家的、部门的、地方的统计报表统一布置, 自下而上地逐级提供基本统计数据的一种调查方式普查为某一特定目的而专门组织的一次性全面调查, 主要用于了解处于某一时点状态上的社会经济现象的基本全貌1 . 普查通常是一次性的或者周期性的2 . 一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普行结果的准确性3 . 数据一般比较准确,规范化程度较高,可以为抽样调查或其他调查提供基本依据4 . 使用范围比较窄,只能调查一些最基本及特定的现象1. 经济普查每10年进行两次,分别在每逢年份的末尾数字为3、8 的年份实施2 . 人口普查逢“0” 的年份进行3 . 农业普查逢“6” 的年份进行,均为每10年一次抽样调查从调查对象的总体中随机抽取一部分单位作为样本进行调查, 并根据样本调查结果来1. 经济性( 最显著优点)2 . 时效性强:可以迅速、及时地获得所需要的信息,弥补全面调查的不足3 . 适应面广:适用于各个领域 推断总体数量特征的一种非全面调查4 . 准确性高:误差往往很小重点调查从调查对象的全部单位中选择少数重点单位进行调查1 . 重点单位虽然只是全部单位中的一部分,但就调查的标志值来说在总体中占绝大比重2 . 调查单位不是随机抽取的,结果不能推断总体3 . 适用范围很广4 . 调查目的只要求了解基本状况和发展趋势【 示例】调查全国工业企业的资产总额情况, 只需对全国大中型工业企业进行重点调查即可。

      因为虽然大中型工业企业数占全国工业企业数不到5 % , 但这些大中型企业的资产总额却占全国工业的6 0 %以上典型调查根据调查的目的与要求, 在对被调查对象进行全面分析的基础上, 有意识地选择若干具有典型意义的或有代表性的单位进行的调查作用:1 . 弥补全面调查的不足2 . 在一定条件下可以验证全面调查数据的真实性【 例 题 •单选题】 ( 2 02 0年)第七次全国人口普查与第六次全国人口普查相同,普查标准时间定为普查年份的( )A . 1 月 1 日0 时B . 11月 1 日0 时C . 7月 1 日0 时D . 12 月 3 1 日 时『 正确答案』B『 答案解析』第六次人口普查的标准时间为普查年份的11月 1 日 例 题 •多选题】 ( 2 02 0年)关于抽样调查的说法,正确的有( )A . 抽样调查只抽取部分样本进行调查B . 抽样调查的时效性强C . 抽样调查耗费大量人力、物力、财力D . 抽样调查根据样本调查结果推断总体数量特征E. 抽样调查工作量小『 正确答案』A B D E『 答案解析』 抽样调查是从调查对象的总体中抽取一部分单位作为样本进行调查, 并根据样本调查结果来推断总体数量特征的一种非全面调查。

      所以A D 正确抽样调查具有经济性、时效性强、适应面广的特点由于调查的样本单位通常是总体单位中的很小一部分,调查的工作量小,因而可以节省大量的人力、物力、财力和时间所以B E正确,C错误 例 题 • 单选题】为及时了解全国城市商品零售价格的变动趋势,按照商品零售额排序对前3 5 个大中型城市的商品零售价格变化情况进行调查,这种调查方法属于( )A . 全面调查B . 典型调查C . 重点调查D . 随机调查『 正确答案』C『 答案解析』本题考查重点调查重点调查是一种非全面调查, 它是在所要调查的总体中选择一部 分重点单位进行的调查 所选择的重点单位虽然只是全部单位中的一部分, 但就调查的标志值来说在总体中占绝大比重,调查这一部分单位的情况,能够大致反映被调查对象的基本情况 例 题 • 多选题】普查的特点有( )A . 使用范围广,适用于各个领域B . 需要耗费大量的人力、物力和财力C . 周期性的普查通常需要间隔较长时间D . 规范化程度较高E. 一般需要规定统一的标准调查时间『 正确答案』B C D E『 答案解析』本题考查统计调查的方式普查的特点: ( 1)普查通常是一次性的或周期性的,由于普查涉及面广、 调查单位多, 需要耗费大量的人力、 物力和财力, 通常需要间隔较长的时间;( 2 )普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性;( 3 )普查的数据一般比较准确,规范化程度也比较高,因此它可以为抽样调查或其他调查提供基本依据; ( 4 )普查的使用范围比较窄,只能调查一些最基本及特定的现象。

      知识点五:数据科学与大数据( -)数据科学:一门通过系统性研究获取与数据相关的知识体系的学科数据科学一方面研究数据本身的特性和变化规律, 另一方面通过对数据的研究为自然科学和社会科学提供一种新的方法, 从而揭示自然界和人类行为的现象和规律包含:对数据进行采集、存储、处理、分析、表现等一系列活动研究对象数据研究目标通过对数据的分析,来解释、预测、洞见和决策,为现实世界服务( 二)大数据:指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、 洞察发现力和流程优化能力的海量、 高增长率和多样化的信息资产大数据特征( 多选)数据量大大数据的起始计量单位是P B ( 1 0 2 4 T B )、E B 或 Z B数据多样性( 多选)包括网络日志、音频、视频、图片、地理位置等各种结构化、半结构化和非结构化的数据1 . 结构化数据:指存储在数据库里,可以用二维表结构实现表达的数据2 . 非结构化数据:数据结构不规则或不完整,没有预定义的数据,包括所有格式的办公文档、文本、图片、报表、图像、音频信息、视频信息等3 . 半结构化数据:介于完全结构化数据和完全非结构化数据之间的数据, 具有一定的结构性; 例如员工简历, 有的简历只有教育情况, 有的简历包括教育、 婚姻、户籍、出入境等很多信息价值密度低 大数据价值密度的高低与数据总量的大小成反比数据的产生和处理速度快一般要在秒级时间范围内给出分析结果, 超出这个时间数据就可能失去价值,即大数据的处理要符合“ 1 秒定律”( 三)数据挖掘:从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐臧在其中但又有潜在价值的信息和知识的过程。

      数据挖掘内涵: ( 多选上数据源必须是真实的、大量的、有噪声的 发现的是用户感兴趣的知识发现的知识是可接受、可理解、可运用的 一并不要求发现放之四海而皆准的知识,仅支持特定的发现问题数据挖掘以解决实际问题为出发点,核心任务是对数据关系和特征进行探索2.数据挖掘分为:有指导学习对目标需求的概念进行学习和建模,通过探索数据和建立模型来实现从观察变( 监督学习) 量到目标需求的有效解释无指导学习( 非监督学习)没有明确的标识变量来表达目标概念,主要任务是探索数据之间的内在联系和结构3. 数据挖掘算法:常用的算法有分类、聚类分析、关联分析、趋势与演化分析、特征分析、异常分析等 ( 多选)分类确定目标对象属于哪个预定的类别,以实现对未来潜在的预测需求聚类分析把一组数据按照差异性和相似性分为几个类别,使得同类的数据相似性尽量大,不同类的数据相似性尽可能小,跨类的数据关联性尽可能低关联分析对数据集中反复出现的相关关系和关联性进行挖掘提取, 从而可以根据一个数据项的出现预测其他数据项的出现趋势与演化分析包括数据变化趋势、序列模式分析、周期性分析以及相似程度分析等内容,M计学的回归分析方法经常用于这类问题的分析( 四)数据可视化:借助图形化手段清晰有效地传达与沟通信息。

      ( 多选)可视化优势简单,表现清晰,利用人对形状、颜色、运动的敏感,有效传递信息,帮助用户从数据中发现关系、规律和趋势两大分支科学可视化面向科学与工程领域的数据,如包含空间坐标和几何信息的三维空间测量数据、计算机模拟数据和医学影像数据,重点探索以儿何、拓扑和形状特征来呈现数据中蕴含的规律信息可视化处理对象是非结构化、非几何的抽象数据,如金融交易、社交网络和文本数据【 例 题 •多选题】 ( 2020年)关于大数据多样性的说法,正确的有( )A.大数据只包括结构化数据B.结构化数据是指存储在数据库里,可以用二维表结构实现表达的数据C.半结构化数据是介于完全结构化数据和完全非结构化数据之间的数据D.半结构化数据具有一定的结构性E.非结构化数据是指数据结构不规则或不完整、没有预定义的数据『 正确答案』BCDE『 答案解析』大数据类型繁多,包括网络日志、音频、视频、图片、地理位置等各种结构化、半结构化和非结构化的数据结构化数据是指存储在数据库里,可以用二维表结构实现表达的数据;非结构化数据是指数据结构不规则或不完整,没有预定义的数据,包括所有格式的办公文档、文本、图片、报表、图像、音频信息、视频信息等;半结构化数据是介于完全结构化数据和完全非结构化数据之间的数据, 具有一定的结构性, 例如员工简历, 有的简历只有教育情况, 有的简历包括教育、婚姻、户籍、出入境等很多信息。

      例 题 •多选题】 ( 2020年)关于数据可视化的说法,正确的有( )A.数据可视化借助图形化手段清晰有效地传达与沟通信息 B . 数据可视化包含科学可视化和信息可视化两个重点分支C . 数据可视化传达的信息比较复杂,需要专业解读D . 科学可视化面向科学与工程领域数据E . 信息可视化的处理对象是非结构化、非几何的抽象数据『 正确答案』A B D E『 答案解析』 数据可视化, 即借助图形化手段清晰有效地传达与沟通信息 可视化的优势在于简单,表现清晰,利用人对形状、颜色、运动的敏感,有效传递信息,帮助用户从数据中发现关系、规律和趋势所以C错误数据可视化包含两个重点分支:科学可视化和信息可视化科学可视化面向科学与工程领域的数据;信息可视化的处理对象是非结构化、非几何的抽象数据 例 题 • 多选题】以下属于大数据特征的有( ).A . 数据量大B . 数据多样性C . 数据的产生和处理速度快D . 价值密度高E . 价值高『 正确答案』A B C『 答案解析』本题考查大数据特征大数据的特征有:数据量大、数据多样性、价值密度低、数据的产生和处理速度快 本章考情年份单选题多选题合计2 0 2 0 年4题 4分0题 。

      分4分2 0 1 9 年2 题 2分1 题 2分4分2 0 1 8 年3 题 3 分1 题 2分5分本章重点:1 . 测度数据集中趋势的统计量:均值、中位数和众数2 . 测度数据离散程度的统计量:方差、标准差和离散系数3 . 测度数据分布偏态的统计量:偏态系数、标准分数4 . 测度变量相关关系的统计量:散点图、相关系数知识点一:集中趋势的测度1 . 均值• 平均数,数据组中所有数值的总和除以该组数值的个数均值是集中趋势最主要的测度值,它是一组数据的重心所在,解释了一组数据的平均水平a- 无 +冗 +… …+X 二 月n n【 示例】某售货小组5名营业员,元旦一天的销售额分别为5 20 元、6 0 0 元、4 8 0 元、7 5 0 元和5 0 0元,求该日平均销售额平均销售额= ( 5 20 + 6 0 0 + 4 8 0 + 7 5 0 + 5 0 0 ) + 5 = 5 7 0 ( 元)【 注 意 1 】均值主要适用于数值型数据,但不适用于分类和顺序数据 注意2】均值容易受到极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代表性减弱。

      需要全部信息避不开极端值!2 . 中位数把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫作中位数, 用M e 表示:'当n为奇数时2-( xn +Xn ) 当n为偶数时I 2中( 产【 注 意 1 】中位数是一个位置代表值,主要用于顺序数据和数值型数据,但不适用于分类数据 注意2】中位数的优点:不受极端值的影响,抗干扰性强,尤其适用于偏斜分布的数值型数据不需要全部信息能避开极端值!3 . 众数:一组数据中出现次数( 频数)最多的变量值不适用于描述定量数据的集中位置 注意】适用于描述分类数据和顺序数据的集中趋势在定量数据中,可能出现多众数和无众数的情况,因此众数不适于描述定量数据的集中位置不需要全部信息能避开极端值!总结:指标适用特点均值定量变量• 利用全部信息,受极端值影响• 如有明显极端值,则代表性差中位数顺序变量定量变量• 不受极端值影响• 适用于分布不对称的数据 •没有充分利用全部信息,稳定性优于众数,差于均值众数分类变量顺序变量• 没有充分利用全部信息,不受极端值影响• 适用于分布明显呈偏态的数据• 可能不唯一【 例题•单选题】 ( 20 20 年)在测度数据集中趋势时,中位数与众数的共同优点是( )。

      A . 能够充分利用数据的全部信息B . 适用于分类变量C . 适用于定量变量D . 不受极端值影响『 正确答案』D『 答案解析』中位数与众数的共同优点是都不受极端值的影响 例 题 •单选题】20 1 9 年某企业集团下辖8个分公司的销售额分别为1 0 0 0 0 万元、3 6 0 0 万元、8 0 0万元、1 0 0 0 万元、6 0 0 万元、3 0 0 0 万元、28 0 0 万元、220 0 万元,这组数据中的中位数是( )万元A . 220 0B . 28 0 0C . 25 0 0D . 3 0 0 0『 正确答案』C『 答案解析』本题考查中位数的计算 ( 28 0 0 + 220 0 )/ 2= 25 0 0 知识点二:离散程度的测度( 一)方差和标准差离散程度:反映数据之间的差异程度集中趋势的测度值对一组数据的代表程度, 取决于该组数据的离散水平数据的离散程度越大,集中趋势的测度值对该组数据的代表性就 壁 ;离散程度越 小 , 其代表性就越好1 . 方差( 1 )方差:数据组中各数值与其均值离差平方的平均数 2)方差越 小 , 说明数据值与均值的平均距离越小,均值的代表性越好。

      》总体方差公式:- x): N .----------- s2=—! - y(Y -Y )2N N -lti* '》样本方差公式:Z ( X-.-x)2< -2 _ JJ______一 ( n-1)【 示例】某售货小组5名营业员,元旦一天的销售额分别为5 20 元、6 0 0 元、4 8 0 元、7 5 0 元和5 0 0元,平均销售额为5 7 0 元,计算日销售额的样本方差 Z(x, -x )2c2 — _______—(n-1)= [ ( 5 2 0 - 5 7 0 ) 2+ ( 6 0 0 -5 7 0 ) 2+ ( 4 8 0 -5 7 0 ) 2+ ( 7 5 0 -5 7 0 ) 2+ ( 5 0 0 -5 7 0 ) 21 4 - ( 5 -1 )= 1 220 0 ( 元—2. 标准差方差是反映数据离散程度的重要测度指标, 但是其单位是原数据单位的平方, 没有解释意义 因此,我们经常使用标准差来测度数据的离散程度,标准差即方差的平方根标准差与方差只适用于数值型数据,它们对极端值很敏感Z W -X )2【 示例】5 名营业员元旦当天的销售额的标准差= ^2200=110.45 (ye)( 二) 离散系数1 . 离散系数:变异系数或标准差系数。

      2 . 标准差与均值的比值:scv= 2X3 . 适用:不同类别数据离散程度的比较 注意】标准差的大小不仅与数据的测度单位有关,也与观测值的均值大小有关,不能直接用标准差比较不同变量的离散程度离散系数消除了测度单位和观测值水平不同的影响,因而可以直接用来比较变量的离散程度 示例】某学校学生的平均年龄为2 0 岁,标准差为3岁;该校教师的平均年龄为3 8 岁,标准差为3岁比较该校学生年龄和教师年龄的离散程度『 正确答案』学生年龄的离散程度更大『 答案解析』学生年龄的离散系数= 3 / 2 0 = 0 . 1 5教师年龄的离散系数= 3 / 3 8 = 0 . 0 7 8 9【 例题•单选题】 ( 2 0 2 0 年) 与标准差相比,方差在测度数据离散程度时的缺点是( ) A . 计算方法复杂B . 不适用于数值型数据C . 其单位是原数据单位的平方,没有解释意义D . 数学性质较差『 正确答案』C『 答案解析』方差是反映数据离散程度的重要测度指标,但是其单位是原数据单位的平方,没有解释意义 例 题 • 多选题】下列统计量中,容易受极端值影响的有( ) A . 均值B . 方差C . 众数D . 中位数 E . 标准差『 正确答案』A B E『 答案解析』 本题考查集中趋势和离散程度的测度指标。

      均值、 方差、 标准差容易受极端值的影响 例 题 •单选题】 根据2 0 1 4 年某城市金融业和制造业各1 0 0 0 人的年薪样本数据来比较这两个行业从业人员年薪的离散程度,应采用的统计量是( )A . 标准分数B . 相关系数C . 变异系数D . 偏态系数『 正确答案』C『 答案解析』 本题考查离散系数 离散系数也称为变异系数或标准差系数, 即标准差与均值的比值,主要用于不同类别数据离散程度的比较知识点三:分布形态的测度( 一)偏态系数( S K ):L偏度:指数据分布的偏斜方向和程度,描述数据分布对称程度 ( 单选)2 . 偏态系数:测度数据分布偏度的指标偏态系数取决于离差三次方的平均数与标准差三次方的比值/ —SR. 〃 g X「X( n-1) ( n-2) ;=1 k s ,3 . 应用:偏态系数的绝对值越大,说明数据分布的偏斜程度越大S K = 0说明数据分布是对称的S K > 01 . 说明数据分布为右偏偏态系数为正 2 . 取值0〜0 . 5 ( 说明轻度右偏)0 . 5 ~ 1 ( 说明中度右偏)大 于 1 ( 说明严重右值偏)S K < 01 . 说明数据分布为左偏偏态系数为负 2 . 0 ~ -0 . 5 ( 说明轻度左偏)一0 . 5 ~ -1 ( 说明中度左偏)小于一1 ( 说明严值重: 左偏)【 例 题 •单选题】 ( 2 0 2 0 年)下列统计量中,用于测度数据分布偏度的是( )。

      A . 方差B . 标准差C . 偏态系数D . 均值『 正确答案』C『 答案解析』测度数据分布偏度的统计量称为偏态系数 例 题 • 单选题】 ( 2 0 2 0 年)如果一组数据的偏态系数为- 0 . 4,则该组数据的分布为( )A . 轻度左偏B . 中度左偏C . 中度右偏D . 轻度右偏『 正确答案』A『 答案解析』偏态系数为0 , 说明数据的分布是对称的偏态系数为正,说明分布是右偏的,取值 在 0〜0 . 5 之间说明轻度右偏,取值在0 . 5〜1 之间,说明中度右偏,取值大于1 说明严重右偏;偏态系数为负,说明分布为左偏,取值在0 ^ 0 . 5 之间,说明轻度左偏,取值在一0 . 5〜一1 之间,说明中度左偏,取值小于一1 , 说明严重左偏本题中,偏态系数为- 0 . 4 , 说明轻度左偏 例 题 • 单选题】关于偏态系数的说法,正确的是( ) A . 偏态系数为正值,说明数据对称B . 偏态系数的绝对值越大,说明数据越对称C . 偏态系数等于0 ,说明数据对称D . 偏态系数等于1 , 说明数据对称『 正确答案』C『 答案解析』本题考查偏态系数如果偏态系数为正值,说明分布为右偏的。

      A选项错误偏态系数的绝对值越大,说明数据分布的偏斜程度越大B选项错误偏态系数等于0 , 说明数据对称C选项正确偏态系数等于1 , 说明系数中度右偏D 选项错误 例 题 •多选题】在某电商网站上,商品甲得到6个评价得分,分别是1 、4 、4 、5 、5 、5 ;商品乙得到5个评分,分别是3 、3 、3 、4 、4 o关于这两组数据的说法,正确的有( )A . 商品甲的评分中位数高于商品乙B . 商品甲的评分均值低于商品乙C . 商品甲的评分众数高于商品乙D . 商品甲的评分分布离散程度大于商品乙E . 商品甲的评分分布是左偏的『 正确答案』A C D E『 答案解析』本题考查集中趋势、离散程度的测度商品甲:评分中位数= ( 4 + 5 ) / 2 = 4 . 5 ,众数=5,均值= ( 1 + 4 + 4 + 5 + 5 + 5 ) / 6 = 4 , 方差 =[ ( 1 - 4 ) ° + ( 4 —4 ) " + ( 4 —4 ) 2+ ( 5 —4 ) " + ( 5 —4 ) ' + ( 5—4 ) ] / 5 =2 . 4 , 标准差= 1 . 5 5 ,离散系数= 1 . 5 5 / 4 =0 . 3 8 7 5 。

      商品乙:评分中位数= 3, 众数= 3, 均值=3 . 4 , 标准差=0 . 5 5 ,离散系数=0 . 5 5 / 3 . 4 =0 . 1 6 由于商品甲离差三次方,即 ( 1 -4 ) s + ( 4 -4 ) 3+ ( 4 -4 ) 3+ ( 5 -4 ) 3+ ( 5 -4 ) 3+ ( 5-4 ) 3= - 2 4 , 根据公式可知偏态系数为负,说明数据分布左偏 二 )标准分数1 . 标准分数( Z 分 数 ):统计学上常用的一种标准化方法标准分数可以给出数值距离均值的相对位置, 用于比较不同分布的变量值2 . 公式:标准分数2= ( 数值一均值)+标准差3 . 结果:标准分数Z 越大越好 注意】转变后的标准分数并没有改变数值在原分布中的位置,也没有改变数据原分布的偏度,但是标准分数的平均数为0 , 标准差为1 示 例 1 】考核A中员工得分8 0 分,均值8 0 分,标准差为2 0 分,在考核B中员工得分7 0 分,均值 6 0 分,标准差为5分8 0 分的 Z 分数=( 8 0 -8 0 ) + 2 0 = 07 0 分的 Z 分数=( 7 0 -6 0 ) + 5 = 2【 说明】7 0 分在考核B中的相对排名高于8 0 分在考核A中的相对排名。

      示例2 】某班期末考试语文考试全班平均成绩7 3 分,标准差7 分,甲得了 7 8 分;数学考试全班平均成绩8 0 分,标准差6 . 5 分,甲得了 8 3 分.甲哪一门成绩更优秀?因为两科分布( 均值、 标准差)不同, 不能用原始数据直接比较,需要转换成标准分数, 然后比较Z ( 语 文 )=( 7 8 -7 3 ) 4 -7 =0 . 7 1 Z ( 数学)=( 8 3 -8 0 ) +6 . 5 =0 . 4 6【 说明】甲的语文成绩更优秀4 . 实际应用:当数据服从对称的钟形分布时, 可以运用经验法则来判断与均值的距离在特定倍数标准差之内的数据项所占比例约有蟹 的 数 据与平均数的距离在1 个标准差之内,标准分数在[ -1 , 1 ]范围内;约有型 的 数 据与平均数的距离在2 个标准差之内,标准分数在[ 一 数 2 ]范围内;约有整 的 数 据与平均数的距离在3 个标准差之内,标准分数在[ -3 , 3 ]范围内 示例】语文考试全班平均成绩7 3 分,标准差7 分:则 6 8 % 的同学得分在6 6 和 8 0 之间;则 9 5 % 的同学得分在5 9 和 8 7 之间;则 9 9 % 的同学得分在5 2 和 9 4 之间。

      例 题 •单选题】某公司员工年度业绩考核中,全体员工考核成绩的均值为8 0 ,方差为2 5 某员工在这次业绩考核中成绩为8 5 , 则该员工考核成绩的标准分数为( )A . 3 . 4B . 0 . 2C . 1 . 0D . 1 7 . 0『 正确答案』C『 答案解析』本题考查分布形态的测度标准分数可以给出数值距离均值的相对位置,计算方法是用数值减去均值所得的差除以标准差,标准分数=( 8 5 —8 0 )/ 5 = 1 例题•多选题】某企业客户满意度数据服从对称的钟形分布,均值为7 5 ,标准差为5 根据经验法则,关于该企业客户满意度的说法,正确的有( )A . 约有-6 8 % 的客户满意度在[ 7 0 , 8 0 ]范围内B . 约有6 8 % 的客户满意度在[ 7 5 , 8 5 ]范围内C . 约有9 5 % 的客户满意度在[ 7 5 , 9 5 ]范围内D . 约有9 5 % 的客户满意度在[ 6 5 , 8 5 ]范围内E . 约有-9 9 % 的客户满意度在[ 6 0 , 9 0 ]范围内『 正确答案』A D E『 答案解析』本题考查标准分数经验法则表明:约有6 8 % 的数据与平均数的距离在1 个标准差之内,约有9 5 % 的数据与平均数的距离在2个标准差之内,约有9 9 % 的数据与平均数的距离在3个标准差之内。

      知识点四:变量间的相关分析 ( 一)相关关系分类1 . 按相关的程度:完全相关、不完全相关和不相关2 . 按相关的方向:正相关和负相关3 . 按相关的形式:线性相关和非线性相关[ 注意]相关关系并不等同于因果关系 二)两变量的散点图:两个变量间的关系可以用散点图来展示L观测点分布无规律:不相关2 . 观测点分布密集在一条线周围:线性相关 1 )正相关:直线向右上倾斜;( 2 )负相关:直线向右下倾斜3 . 观测点呈现曲线模式:两个变量非线性相关.( 三)相关系数的定义和计算1. P ea r s o n 相关系数:度量的是两个变量之间的线性相关关系2. P ea r s o n 相关系数的取值范围:一I W r W l 1) 0 - 1 :变量X 和 Y之间存在正线性相关关系;( 2) - l ^ r < 0 :变量X 和 Y之间存在负线性相关关系;⑶r = l :变量X和 Y之间为完全正线性相关,即变量丫的取值完全依赖于变量X ;( 4 ) r=~l :变量X和 Y 之间为完全负线性相关,即变量Y的取值完全依赖于变量X 注意】P ea r s o n 相关系数只适用于线性相关关系的判断。

      因此r=0 只表示两个变量之间不存性相关关系,并不说明变量之间没有任何关系,比如它们之间可能存在非线性相关关系o3.相关程度:( 1)| r > 0.8: 高度相关;( 2)0.5 < | r | <0.8: 中度相关:( 3)0.3< | r | <0.5 : 低度相关:( 4 )| r | <0-3:说明两个变量之间的相关程度极弱,可视为无线性相关关系 例 题 • 多选题】关于相关关系的说法,正确的有( )A .完全相关是指一个变量的取值变化完全由另一个变量的取值变化所确定B .相关关系等同于因果关系C .正相关是指一个变量的取值随着另一个变量的取值增大而增大D .不相关是指两个变量的取值变化彼此互不影响E .相关关系等同于函数关系『 正确答案』A C D『 答案解析』本题考查变量间的相关关系相关关系并不等同于因果关系和函数关系 例题•单选题】根据下面的变量X和变量Y的散点图,可以看出这两个变量的P ea r s o n 相关系数r的取值范围是( ). i5 ( r100-B. 0 W r< lC. r 2 lD. - lW r< 0『 正确答案』D『 答案解析』本题考查散点图与相关关系。

      若一l W r < 0 ,表明变量X和Y之间存在负线性相关关系 例 题 • 单选题】2014年某企业员工的工龄和月平均工资的散点图如下:1000 工 龄 (年 )5000根据以上散点图,工龄和月平均工资两个变量的相关关系是( )A.正相关、线性相关B.负相关、线性相关C.正相关、非线性相关D.负相关、非线性相关『 正确答案』C『 答案解析』本题考查散点图首先,观测点的走势很容易判断出是正相关关系;其次,观测点呈现出曲线模式,并不是直线的模式,所以两个变量为非线性相关关系 均均、中位数、众数d集中趋势测度H三者的关系及适用范围方差、标准差- I离散程度测度H离散系数、变异系数偏态系数SK、取值相关关系分类 程度、方向、形式散点图 规律变量相关关系分析卜相关系数 取值范围相关程度 本章考情年份单选题多选题合计2020 年1题 1 分1 题 2 分3 分2019 年1 题 1 分2 题 4分5分2018 年4题 4分1题 2 分6分本章重点:L抽样调查基本概念:总体、样本、样本量、总体参数、样本统计量与抽样框2.概率抽样和非概率抽样,抽样误差和非抽样误差( 抽样框误差、无回答误差、计量误差)。

      3.几种基本概率抽样方法:简单随机抽样、分层抽样、系统抽样、整群抽样和多阶段抽样4 .估计量的性质,抽样误差影响因素,样本量的影响因素知识点一:抽样调查基本概念( - )抽样调查基本概念1 .总体:调查对象的全体,调查总体必须是明确的而不能是模糊的 示例】研究全国钢铁企业盈利状况, 所有钢铁企业是总体2 .样本:总体的一部分,它由从总体中按一定原则或程序抽出的部分个体所组成样本量:样本中包含的入样单位的个数 示例】选取了 2 0 家钢铁企业是样本3 . 抽样框:供抽样所用的所有抽样单元的名单,是抽样总体的具体表现 示例】工商局注册的2 0 0 家企业;公司2 0 0 名注册在职人员名册4 . 总体参数:变量的数字特征,根据总体中所有单位的数值计算的 示例】所有钢铁企业盈利总额, 所有钢铁企业盈利均值5 . 样本统计量:根据样本中各单位的数值计算的,是对总体参数的估计,因此也称为估计量常用的样本统计量:样本均值,样本比例、样本方差等 示例】2 0 家企业盈利总额, 2 0 家企业盈利均值 例 题 • 单选题】供抽样所用的所有抽样单元的名单称为( )A. 抽样框B . 总体C . 总体参数D . 样本『 正确答案』A『 答案解析』本题考查抽样框。

      抽样框是供抽样所用的所有抽样单元的名单,是抽样总体的具体表现 例题•单选题】从某单位所有在职员工中随机抽取3 0 0 人进行抽样调查,来研究该单位在职职工中亚健康人员占比状况,该项调查的总体是( )A. 随机抽取的3 0 0 名在职员工B . 该单位所有亚健康在职员工C . 该单位所有在职员工D . 被调查的3 0 0 名在职员工中的亚健康员工『 正确答案』C『 答案解析』 本题考查抽样调查的基本概念 总体即调查对象的全体, 也就是该单位所有在职员工 -)概率抽样与非概率抽样根据抽取样本方法的不同,抽样分为:1 . 概率抽样( 随机抽样):指依据随机原则,按照某种事先设计的程序,从总体中抽取部分单元的 方法 1 )随机原则:在抽取样本时排除主观上有意识地抽取调查单元的情况,使每个单元都有一定的机会被抽中 2 )特点:J 按一定的概率以随机原则抽取样本;J总体中每个单元被抽中的概率是已知的,或者是可以计算出来的;V当采用样本对总体参数进行估计时,要考虑到每个样本单元被抽中的概率 3 )分类:等概率抽柱每个单位被抽入样本的概率相等不等概率抽样每个单位被抽入样本的概率不同2 . 非概率抽样( 非随机抽样):调查者根据自己的方便或主观判断抽取样本的方法。

      1 )最主要的特征:抽取样本时并不是依据随机原则 2 )非概率抽样方法( 多选):判断抽样调查人员依据调查目的和对调查对象情况的了解,人为确定样本单元,例如:选 择 “ 平均型”单元作为样本,代表研究变量的平均水平方便抽怛依据方便原则,以达到最大限度降低调查成本的目的,例如: “ 拦截式”调查自愿样正不是经过抽取,由自愿接受调查的单元所组成的样本,典型: “ 网上调查”配额抽样将总体中的各单元按一定标准划分为若干类型,将样本数额分配到各类型中,从各类型中抽取样本的方法没有严格限制,一般采用方便抽样方法抽取样本单元例如:某高校2 0 0 0 名学生,男生6 0 % , 女生4 0 % , 抽取一个1 0 0 人样本配额样本,男生6 0 人,女生4 0 人【 例 题 •单选题】 ( 2 0 2 0 年)在抽取样本时,调查人员依据调查目的和对调查对象情况的了解,人为确定样本单元这种抽样调查方法称为( )A. 判断抽样B . 方便抽样C . 配额抽样D . 简单随机抽样『 正确答案』A『 答案解析』判断抽样是指调查人员根据调查目的和对调查对象情况的了解,人为确定样本单元 例 题 • 多选题】随机抽样的特点主要包括( )。

      A. 每个总体单元被抽入样本的概率都相等B . 以最大限度降低调查成本为目的C . 调查者可以根据自己的主观判断抽取样本D . 总体中每个单元都有一定的机会被抽中E . 总体中每个单元被抽中的概率是已知或可计算的『 正确答案』D E『 答案解析』本题考查随机抽样随机抽样的特点: ( 1 ) 按一定的概率以随机原则抽取样本; ( 2 )总体中每个单元被抽中的概率是已知的,或者是可以计算出来的; ( 3 )当采用样本对总体参数进行估计时,要考虑到每个样本单元被抽中的概率 ( 三 )抽样调查中的误差1 . 误 差 : 样本估计值和总体参数真值之间的差异凡调查就一定有误差,误差或大或小总会存在,不可能完全避免2 . 误差分类:( 1 )抽样误差:由于抽样的随机性造成的,用样本统计量估计总体参数时出现的误差抽样误差产生的根本原因:抽到哪一个样本完全是随机的,而抽到不同的样本,对总体的估计就会不同 示例L2 , 4, 6 , 8四个数的均值为5 _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _样本样本估计量2 , 436 , 87( 2 )非抽样误差:除抽样误差之外,由其他原因引起的样本统计量与总体真值之间的差异。

      3. 韭抽样误差产生的原因( 多选):抽样框抽样框不完善造成用工商局签发的营业执照作为抽样框,掌握个体商业零售额情况,有些无照经营、有些有执照但不再经商、有些有一个摊点却办理多个营业执照,易造成结果失真误差无回答调查人员没能从被调查者那里得到所需要的数据随机因素:被调查者恰巧不在家;误差非随机因素:被调查者不愿告诉实情而拒绝回答计量壁调查所获得的数据与其真值之间不一致;由调查人员、 问卷设计、受访者等原因造成调查员在调查中有意无意地诱导被调查者;记录答案错误;对调查问题的理解有偏误;受访者提供虚假数字等【 例 题 • 多选题】在城乡住户收支调查中,非抽样误差的可能来源有( )A .抽样框遗漏掉部分城乡住户B .部分高收入住户拒绝接受调查C. 调查人员有意作弊D .被调查住户提供虚假数据E .抽样的随机性『 正确答案』A B C D『 答案解析』本题可采用排除法,排 除 “ 随机性”即可选择 例 题 •单选题】由于受访者记忆模糊,导致调查数据与其真值之间不一致,这种误差属于( )A .抽样误差B .抽样框误差C .无回答误差D .计量误差『 正确答案』D『 答案解析』本题考查抽样调查中的误差。

      计量误差是由调查人员、问卷设计、受访者等原因造成的如调查员在调查中有意无意地诱导被调查者;记录答案错误;调查人员有意作弊;由于问卷的原因受访者对调查问题的理解有偏误;受访者记忆不清;受访者提供虚假数字等 知识点二:几种基本概率抽样方法( 5 种)( -)简单随机抽样1 . 简单随机抽样:最基本的随机抽样方法分为:类型含义特点有放回简单随机抽样从总体中随机抽出一个样本单位, 记录观察结果后, 将其放回总体中, 再取第二个样本单位有被重复抽中的可能, 容易造成信息重叠而影响估计的效率,所以较少采用不放回简单随机抽样每次都在所有尚未被抽入样本的单元中等概率的抽取下一个单元每个单位最多只能被抽中一次, 比有放回抽样的抽样误差低2 . 特点及适用条件优点操作简单,每个单位的入样概率相同缺点( 1 ) 未利用抽样框中更多的辅助信息, 用样本统计量估计总体参数的效率受到影响( 2 )样本分布可能十分分散,增加了调查过程中的费用和时间适用条件( 1 )抽样框中没有更多可以利用的辅助信息( 2 )调查对象分布的范围不广阔( 3 )个体之间的差异不是很大( 二)分层抽样1 . 分层抽样:指先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机地抽取样本,这样所得到的样本称为分层样本。

      示例】某地区3 0 0 家商店,为掌握各商店的营业情况抽取2 0 个样本设计的分层抽样为:大型商店3 0 家,从中抽取5家;中型商店7 5 家,从中抽取5家;小型商店1 9 5 家,从中抽取1 0 家2 . 特点:( 1 )既可以估计总体参数,同时也可以估计各层的参数 2 )便于抽样工作的组织:分层编制抽样框 3 )每层都要抽取一定的样本单位,这样样本在总体中分布比较均匀,可以降低抽样误差3 . 样本量在各层中分配的方法:等比例分配层中单位数越多,该层中抽取的样本单位就越多,该层的样本单位比例与层中的总体单位比例相一致不等比例分配( 1 )各层单位数相差悬殊:如果按等比例抽样,总体单位数少的层所分到的样本量过小,代表性不足,就需要在该层适当增大样本量( 2 )有些层内的方差过大:为了降低抽样误差,在方差大的层中多抽,在方差小的层中少抽【 注意】如果各层的总体方差已知, 不等比例抽样的抽样误差可能比等比例抽样更小4 . 适用条件:( 1 )抽样框中有足够的辅助信息,能将总体单位按某种标准划分到各层中;( 2 )同层内,各单位之间的差异尽可能地小,不同层之间各单位的差异尽可能地大 三)系统抽样1 . 系统抽样:指先将总体中的所有单元按一定顺序排列, 在 规定范围内随机抽取一个初始单元, 然后按事先规定的规则抽取其他样本单元。

      最简单的系统抽样是等距抽样 【 示例】从某学校5000名学生中抽取50名进行体质检查,先对5000名学生进行编号,即 0001〜5000;间隔K =5000/50=100,表示每间隔100名学生抽取1个学生;0001〜0100随机抽取0035号学生作为起点,依次抽取0135, 0235, 0335……, 直到4935, 50个样本抽取完毕2 . 特点优点( 1)操作简便,因为它只需要随机确定起始单位, 整个样本就自然确定了(2) 抽样框的要求也比较简单,只要求总体单位按一定顺序排列,而不一定是一份具体的名录清单缺点方差估计比较复杂,给计算抽样误差带来一定困难3 . 估计效果与总体单位排列顺序有关:(1)无关标识排列:排列顺序与调查内容无联系其估计与简单随机抽样估计效率相仿2)有关标识排列:排列顺序与调查内容有关系统抽样精度一般比简单随机抽样的精度高 示例】对汽车尾气排放情况的调查中, 按汽车牌号排列,牌号与尾气排放没有关系,属于按无关标识排列如果按汽车价格排列,价格与尾气排放量有相关性,属于按有关标识排列 四)整群抽样1 . 整群抽样:将总体中所有的基本单位按照一定规则划分为互不重叠的群, 抽样时直接抽取群, 对抽中的群调查其全部基本单位, 对没有抽中的群则不进行调查。

      示例】在近千户的居民小区中, 调查居民的宽带拥有率从小区内随机抽取15号楼,然后对楼中每一户居民进行调查,用调查的结果来估计整个小区的宽带拥有率2 . 特点及适用条件特点优点( 1)实施调查方便,可以节省费用和时间(2)抽样框编制得以简化,抽样时只需要群的抽样框,而不要求全部基本单位的抽样框缺点抽取的样本单位比较集中,群内各单位之间存在相似性,差异比较小,而群与群之间的差异比较大,使得抽样误差比较大适用条件群内差异大,群与群结构相似( 五)多阶段抽样1 . 多阶段抽样:在大规模抽样调查中,一次抽取到最终样本单位是很难实现的, 往往需要经过两个或两个以上阶段才能抽到最终样本 示例】全国性居民入户调查首先抽取区县,然后在选中的区县中抽居委会,最后在选中的居委会中随机抽取居民户2 . 特点:( 1)抽样分阶段进行,抽样框也可以分级进行准备;( 2)多阶段抽样是在选中的单位中再抽选,使得样本的分布相对集中,节省调查的人力和财力;(3)抽样设计比较复杂,抽样误差计算比较复杂 例 题 •多选题】(2020年)下列抽样调查方法中,属于概率抽样的有( )A.系统抽样B . 判断抽样C.简单随机抽样D.分层抽样E.方便抽样『 正确答案』A CD 『 答案解析』概率抽样包括简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样。

      B E 属于非概率抽样方法 例 题 • 多选题】关于分层抽样设计的说法,正确的有( )A . 不同层间单元的差异尽可能大B . 各层的样本单元比例必须与该层的总体单元比例一致C . 不等比例分层抽样的抽样误差大于等比例分层抽样D . 抽样框中必须有总体单元的分层信息E . 同一层内单元间的差异尽可能小『 正确答案』A D E『 答案解析』 本题考查分层抽样等比例分配是指层中单位数越多,在该层中抽取的样本单位就越多,该层的样本单位比例与该层中的总体单位比例相一致,选项B错误在条件具备时,如果各层的总体方差已知,不等比例抽样的抽样误差可能比等比例抽样更小,选项C 错误 例 题 •多选题】 在某城市的一项在职员工亚健康情况抽样调查中,调查人员先将工作单位按照行业和规模分层,然后在各层内随机抽取初始单位后,等距抽取5家单位,再对被抽中单位内所有员工进行体检和检查该调查中采用的抽样方法有( )A . 分层抽样 B . 简单随机抽样C . 配额抽样 D . 整群抽样E . 系统抽样『 正确答案』A B D E『 答案解析』本题考查几种基本概率抽样方法题干中所述的抽样方法包括分层抽样、简单随机抽样、整群抽样、系统抽样,其中的等距抽样就是最简单的系统抽样。

      “ 等距抽取5 家单位,再对被抽中单位内所有员工进行体检和检查”采用的就是整群抽样的方法知识点三:估计量和样本量( -)估计量的性质【 示例】 _ 2, 4 , 6 这 3个数,抽取2 个作为样本样本样本均值( 估计量)2, 432, 644 , 651 . 估计量的无偏性: 对于不放回简单随机抽样, 所有可能的样本均值取值的平均值总是等于总体均值样本样本均值( 估计量)2, 432, 644 , 65估计量均值= ( 3 + 4 + 5 ) /3 = 4总 体 均 值 = ( 2 + 4 + 6 ) /3 = 42. 估计量的有效性:在同一抽样方案下,对某一总体参数如果有两个无偏估计量口和”,由于样本的随机性, S 的可能样本取值比 2更密集在总体参数真值0附近,认 为 % 比 % 更有效估计量方差:常用于描述抽样误差, 估计量方差越大,说明用可能的样本估计值之间的差异越大,用样本统计量估计总体参数的效率就越低,抽样误差越大 3 . 估计量的一致性:随着样本量的增大, 估计量的值如 果 鳗 于总体参数的真值, 这个估计量就有一致性 示例】2, 4 , 6 这 3个数,抽取2 个作为样本。

      样本样本均值( 估计量)2, 642, 4 , 61【 记忆口诀】一、无、 ( 所)有【 例 题 • 单选题】总体参数的无偏估计量的方差小于其他的无偏估计量的是( )A . 有效性B . 一致性C . 重要性D . 无偏性『 正确答案』A『 答案解析』本题考查估计量的性质 例 题 • 多选题】抽样调查中,估计量的常用选择标准有( )A . 方便性B . 无偏性C . 重要性D . 有效性E . 一致性『 正确答案』B D E『 答案解析』本题考查估计量的性质估计量的常用选择标准包括无偏性、有效性和一致性 -)抽样误差的估计1 . 均值估计量的方差:V ( y) =( 1 - ) -N ny 表示样本均值,n为样本数量( 样本量),N为总体个数,6为总体方差( 总体分布),实践中用样本方差来估计2 . 抽样误差影响因素( 多选)( 1 )总体分布:总体单位值之间差异越大,总体方差越大,抽样误差就越大;( 2)样本量:在其他条件相同情况下,样本量越大,抽样误差就越小;( 3 )抽样方式和估计量的选择 三)样本量的影响因素因素影响调查的精度 调查精度越高( 误差水平越小),需要的样本量越大总体的离散总体的离散程度越大,所需要的样本量也越大程度总体的规模对于大规模的总体, 总体规模对样本量的需求则几乎没有影响; 对于小规模总体,总体规模越大,为保证相同估计精度,样本量也要随之增大( 但不是同比例)无回答情况 在无回答率较高的调查项目中,样本量要大一些,以减少无回答带来的影响经费的制约 样本量是调查经费与调查精度之间的某种折中和平衡 【 例 题 • 多选题】关于样本量的说法,正确的有( )。

      A . 调查误差越小所需的样本量越大B . 总体方差越小所需的样本量越小C . 总体规模越大样本量要同比例增大D . 经费越少样本量越小E . 无回答率越高需要抽取的样本量越大『 正确答案』A B D E『 答案解析』本题考查样本量的影响因素选项C错误,对于大规模的总体,总体规模对样本量的需求几乎没有影响但是对小规模的总体,总体规模越大,为保证相同估计精度,样本量也要随之增大,但不是同比例的 例 题 • 多选题】为有效降低抽样调查中的抽样误差,可采取的措施有( )A . 增大样本量B . 改进估计量C . 加强调查过程中的质量控制D . 加强对访问人员的培训E . 选择更有效的抽样方法『 正确答案』A B E『 答案解析』本题考查抽样调查中的误差误差是样本估计值和总体参数真值之间的差异改进估计量可以降低误差改进估计量时,可以增大样本量,也可以选用更有效的抽样方法简单随机含义、优缺点 分层抽样含义、优缺点 系统抽样含义、优缺点 整群抽样含 义 多 阶 段 抽 样等于 无偏性方差 有效性一致性精度离散程度总体规模无回答情况样本量的影响因素估计量性质概率抽样方法误 差 -产生原因总体、样本、总体参数、样本统计量、抽样框经费点睛张宁概率与非概率抽样非概率方法判断抽样方便抽样自愿样本配额抽样含义 估计量( 统计量) 与参数抽样框误差无回答误差计量误差 本章考情年份单选题多选题合计2 0 1 9 年2 题 2分0题 。

      分2分2 0 1 8 年1 题 1 分1 题 2分3分本章重点:1 . 回归分析和相关分析2 . 一元线性回归模型3 . 最小二乘法4 . 模型的检验和预测知识点一:回归模型( 一)回归分析的概念1 . 回归分析:根据相关关系的具体形态, 选择一个合适的数学模型,来近似地表达变量间的依赖关系2 . 回归分析v s 相关分析( 研究目的和方法有明显区别)( 1 )相关分析需要依赖回归分析表明现象数量相关的具体形式 2 )回归分析依赖相关分析表明现象数量变化的相关程度 3 ) 相关分析无法从一个变量的变化来 回 另 一个变量变化情况, 而回归分析的数学方程式可以 4 )只有当变量之间存在着高度相关时 , 进行回归分析寻求其相关的具体形式才有意义3 . 进行回归分析时,首先需要确定因变量和自变量 1 )因变量:被预测或被解释的变量,一般用Y表示;( 2 )自变量:用来预测或解释因变量的变量,一般用X表示 例 题 • 多选题】关于相关分析和回归分析的说法,正确的有( )A . 相关分析研究变量间相关的方向和相关程度B . 相关分析可以从一个变量的变化来推测另一个变量的变化C . 回归分析研究变量间相互关系的具体形式D . 相关分析和回归分析在研究方法和研究目的上有明显区别E . 相关分析中先要明确自变量和因变量『 正确答案』A C D『 答案解析』 本题考查相关分析与回归分析的联系与区别。

      相关分析不能提出变量间相互关系的具体形式, 也无法从一个变量的变化来推测另一个变量的变化情况, 所以B 项错误 进行回归分析时,首先需要确定因变量和自变量,所以E项错误 -)一元线性回归模型1 . 回归模型分类( 1 )根据自变量的多少:一元回归模型和多元回归模型 2 )根据回归模型是否是线性:线性回归模型和非线性回归模型2 . 一元线性回归模型: 描述两个变量之间相关关系的最简单的回归模型 一元线性回归是只涉及一个自变量的回归问题1 ' = 必 +J3IX+S【 注 意 1 】线性函数M+BiX:反映由于自变量X变化而引起的因变量Y的线性变化[ 注意2 ]误差项J随机变量,表示除 X和 Y的线性关系之外的随机因素对Y的影响;不能由X和 Y的线性关系所解释的Y的变异性 三)回归方程:描述因变量Y的期望E ( Y )如何依赖自变量X的方程一元线性回归方程:E ( Y ) =M+BiX YAE (Y) =Bo+ B1XB L--------------------->x【 注 意 i] 一元线性回归方程的图示是一条直线 注意2】Bo是回归直线的截距,是回归直线的斜 率 , 表明X 每变动一个单位,E ( Y)的变动【 例 题 •单选题】 ( 2019年)一元回归模型和多元回归模型的划分依据是( )。

      A.模型的数量B.样本量C.因变量数量D.自变量数量『 正确答案』D『 答案解析』本题考查一元线性回归模型根据自变量的多少,回归模型可以分为一元回归模型和多元回归模型 例 题 •单选题】下列回归模型中,属于一元线性回归模型的是( )A. Y = 3o+ P 凶 + 6 如 + eB. Y = Po+ 6 凶+ M X / + eC . Y = P o + P ^ H - eD.Y=B° +BiX+ £『 正确答案』D『 答案解析』本题考查一元线性回归模型一元线性回归模型只涉及一个自变量,即 丫 = 册 + 6 出+ e 例 题 •单选题】在一元线性回归方程中,回归系数" 的实际意义是( )A.当自变量X = 0 时,因变量Y 的期望值B.当自变量X 变 动 1 个单位时,因变量Y 的平均变动数量C.当自变量X = 0 时,自变量X 的期望值D.当因变量Y 变 动 1 个单位时,自变量X 的平均变动数量『 正确答案』B『 答案解析』" 是回归直线的斜率,表明X 每变动一个单位,E ( Y)的变动量 例 题 • 单选题】线性回归模型中误差项的含义是( )A.回归直线的截距B.回归直线的斜率C.观测值和估计值之间的残值D.除 X 和 Y 线性关系之外的随机因素对Y 的影响『 正确答案』D『 答案解析』本题考查一元线性回归模型。

      误差项是个随机变量,表示除X 和 Y 的线性关系之外的随机因素对Y 的影响,是不能由X 和 Y 的线性关系所解释的Y 的变异性 知识点二:最小二乘法( - )最小二乘法:使得因变量的观测值上与估计值之间的离差平方和最小来估计参数3 和K 的方法 ( 单选)( 二)最小二乘法是对回归模型进行参数估计的方法 三)最小二乘法估计量表达式:AZ (x-x)r = l【 思路】款" 时A A求偏导,令其为0 ,求出参数片和凤的估计量 例 题 • 单选题】最小二乘法的原理是使得( )最小A . 因变量的观测值与自变量的观测值之间的离差平方和B . 因变量的观测值与估计值之间的离差平方和C . 自变量的观测值与均值之间的离差平方和D . 因变量的观测值与均值之间的离差平方和『 正确答案』B『 答案解析』 本题考查最小二乘法 最小二乘法就是使得因变量的观测值与估计值之间的离差平方和最小来估计参数B 和 B ।的方法 例 题 • 单选题】线性回归模型常用的参数估计方法是( )A . 最大二乘法B . 最小残差和法C . 最大残差和法D . 最小二乘法『 正确答案』D『 答案解析』本题考查最小二乘法。

      对回归模型进行估计的方法称为最小二乘法知识点三:模型的检验与预测( 一)回归模型的拟合效果分析1 . 在使用估计的回归方程之前,需要对模型进行检验:( 1 )结合经济理论和经验分析回归系数的经济含义是否合理;( 2 )分析估计的模型对数据的拟合效果如何;( 3 )对模型进行假设检验2 . 决定系数R 2 ( 拟合优度或判定系数):测度回归模型对样本数据的拟合程度说明回归模型所能 解释的因变量变化占因变量总变化的比例 ( 2 0 2 0 年变动)女 : 宁 --------z = l=1一q —7京 乂 -讨Z = 13 . 决定系数的取值:在 0到 1 之间R2=l,说明回归直线可以解释因变量的所有变化♦ =0,说明回归直线无法解释因变量的变化, 因变量的变化与自变量无关4 . 拟合效果:决定系数越接近1 ,回归模型的拟合效果就越 好 , 即模型解释因变量的能力越强决定系数越接近0 ,回归模型的拟合效果就越差5 . 回归系数的显著性检验( t 检验) ( 2 0 2 0 年新增)( 1 ) t 检验方法:验证自变量X对因变量Y是否有显著影响B.=O( 2 ) t 检验的原理是反证法:在原假设已A( 自变量X对因变量Y没有影响)正确的假定下,基 于 B 1 的抽样分布计算一次抽样情况下得到该样本或更极端样本的概率( P值),如果P 〈 0 . 0 5 , 则可以在0 . 0 5 的显著性水平下拒绝原假设,认为自变量X 对因变量Y有显著影响, 国声°【 比一比】决定系数0 W / W 1越接近1 效果越好相关系数0 . 3 , 0 . 5 , 0 . 8—1 W r W l( 无关、低度、中度、高度)偏态系数S K > 00 . 5 , 1S K = 0( 轻度、中度、严重)S K < 0( 二)模型预测:回归分析的一个重要应用就是预 测 ,即利用估计的回归模型预估因变量数值。

      三)二元回归模型( 2 0 2 0 年新增)1 . 多元回归模型在实际应用中, 随着自变量个数的增加, 即使在有些自变量与因变量完全不相关的情况下,决定系数R 2 也会增大2 . 估计的二元线性回归方程Y = -18716.2+ 3669e+ 27144.47p( 1 )年薪Y ( 元)和受教育年限e ( 年)为定量变量,职位p为定性变量,0表示一般职员,1 表示管理者 2 )已知员工甲受教育年限为1 0 年,在该公司为一般职员,可利用该模型预测其年薪大约为:Y = - 18716.2+ 3669X 10=17937.8 ( 元【 例 题 • 多选题】在某城市随机抽取1 0 0 0 户居民作为样本对该城市居民消费水平进行研究,对居民月消费支出Y ( 单位:元)和月收入X ( 单位:元),建立回归模型,得到估计的回归系数Y= 1 3 0 0+0 . 6 X ,决定系数0 . 9 6 ,关于该模型的说法正确的有( )A . 居民月收入和月消费支出之间正相关B . 回归模型的拟合效果很好 C . 居民月收入难以解释月消费支出的变化D . 居民月收入每增长1 元,月消费支出将平均增长0 . 6 元E . 居民月收入为1 0 0 0 0 元时,居民人均月消费支出大约为7 3 0 0 元『 正确答案』A B D E『 答案解析』本题考查模型的检验和预测。

      由Y= 1 3 0 0 +0 . 6 X ,可以看出X和 Y 同方向变化,即正相关,选项A正确;0 . 6表示X每增加一个单位,Y 的平均增加量,选项D正确;将 X = 1 0 0 0 0 元代入回归方程即Y= 1 3 0 0 +0 . 6 X 1 0 0 0 0 = 7 3 0 0 元,选项E正确决定系数0 . 9 6 接近于1 , 可看出回归模型的拟合效果很好,选项B正确,选项C错误 例 题 • 单选题】回归模型决定系数的取值范围是( )A . - 1 到 1 之间B . 大于等于0C . 0到 1 之间D . 没有限制『 正确答案』C『 答案解析』本题考查决定系数决定系数,也称R 2 ,取值在0到 1 之间 例题•单选题】若要定量研究边际消费倾向,并预测一定收入条件下的人均消费金额,适用的统计方法是( )A . 相关分析B . 回归分析C . 偏态分析D . 描述分析『 正确答案』B『 答案解析』本题考查回归分析回归分析的一个重要应用就是预测,即利用估计的回归模型预估因变量数值 例 题 • 多选题】关于回归方程决定系数的说法,正确的有( )A . 决定系数测度回归模型对样本数据的拟合程度B . 决定系数取值越大,回归模型的拟合效果越差C . 决定系数等于1 , 说明回归模型可以解释因变量的所有变化D . 决定系数取值在[ 0 , 1 ] 之间E . 如果决定系数等于1 , 所有观测点都会落在回归直线上『 正确答案』A C D E『 答案解析』本题考查模型的检验和预测。

      决定系数,也称为片,可以测度回归直线对样本数据的拟合程度, 决定系数的取值在0 到 1 之间, 大体上说明了回归模型所能解释的因变量变化占因变量总变化的比例决定系数越高,模型的拟合效果就越好,即模型解释因变量的能力越强如果所有观测点都落在回归直线上,N=l, 说明回归直线可以解释因变量的所有变化 本章考情年份单选题多选题合计2 0 2 0 年1 题 1 分1 题 2 分3 分2 0 1 9 年2 题 2分1 题 2分4分2 0 1 8 年0 题 分1 题 2分2分本章重点:1 . 时间序列的含义及其构成要素,时间序列的分类2 . 发展水平,不同时间序列序时平均数的计算方法,增 长 量 ( 逐期增长量、累计增长量),平均增长量的含义、计算方法3 . 发展速度与增长速度的含义与计算, 定基发展速度与环比发展速度之间的关系, 平均发展速度与平均增长速度的含义与计算方法,速度分析中应注意的问题,增 长 1 % 绝对值的含义及其用途,增 长 1 %绝对值的计算方法4 . 平滑预测法:移动平均法,指数平滑法知识点一:时间序列及其分类( 一)时间序列( 动态数列):将某一统计指标在各个不同时间上的数值按时间先后顺序编制形成的序列。

      -)时间序列由两个基本因素构成:1 . 被研究现象所属时间;2 . 反映该现象在一定时间条件下数量特征的指标值 三)分类:按照指标值的表现形式分为:绝对数时间序列、相对数时间序列、平均数时间序列2 0 1 62 0 1 72 0 1 8国内生产总值国内生产总值第三产业占比人均国内生产总值1 . 绝对数时间序列:由绝对数指标值按时间先后顺序排列后形成的序列, 依据指标值的时间特点又分为:( 1 )时期序列:每一指标值反映现象在一段时期内发展的结果,即 “ 过程总量”,例如:国内生产总值、销售收入 2 )时点序列:每一指标值反映现象在一定时点上的瞬间水平,例如:年底总人口数、库存量连续调查:一段时间的总量,如产品产量、能源的消耗等不连续调查:总体现象在一定时点上的状态,如生产设备拥有量、耕地面积等2 . 相对数时间序列:由同类相对数指标值按时间先后顺序排列后形成的序列例如:第三产业从业人员比重、城镇人口比重3 . 平均数时间序列:由同类平均数指标值按时间先后顺序排列后形成的序列例如:人均国内生产总值 例 题 •单选题】( 2 0 2 0 年) 我国2 0 1 3 ~ 2 0 1 9 年期间城镇单位就业人员平均工资的时间序列如下:按照时间序列的分类,该时间序列属于( )。

      A . 时期序列B. 平均数时间序列C . 时点序列D . 相对数时间序列年份2 0 1 3 2 0 1 4 2 0 1 5 2 0 1 6 2 0 1 7 2 0 1 8 2 0 1 9城镇单位就业人员平均工资( 元)5 1 4 8 3 5 6 3 6 0 6 2 0 2 9 6 7 5 6 9 7 4 3 1 8 8 2 4 1 3 9 0 5 0 1 『 正确答案』B『 答案解析』平均数时间序列是由平均数指标值按时间先后顺序排列后形成的序列 例 题 •单选题】 “ 年底总人口数”指标的时间序列属于( )A . 时点序列B. 平均数时间序列C . 相对数时间序列D . 时期序列『 正确答案』A『 答案解析』本题考查时间序列及其分布时点序列中,每一指标值反映现象在一定时点上的瞬间水平如年底总人口数是说明在各年年末这一时点上人口数所达到的水平知识点二:时间序列的水平分析( 一)发展水平1 . 发展水平:时间序列中对应于具体时间的指标数值 1 )最初水平:序列中第一项的指标值;( 2 )最末水平:最末项的指标值;( 3 )中间水平:处于二者之间的各期指标值2 . 根据各期指标值在计算动态分析指标时的作用来划分:( 1 )基期水平:作为对比的基础时期的水平:( 2 )报告期水平:所 莪 映 与研究的那一时期的水平。

      -)平均发展水平( 序时平均数或动态平均数):对时间序列中各时期发展水平计算的平均数,它可以概括性描述现象在一段时期内所达到的一般水平绝对数时间序列平均发展水平简单算术平均、加权算术平均两次平均、加权两次平均相对数或平均数时间序列平均发展水平- ay =b1 . 绝对数时间序列:同V y . »「时期序列: 亍 = 0二 _ £尤« 「 逐日登记: 3=上^nJ [连 续 时 点 J " NJ"〔 发生变动才记录: 亍 = 4—、 时 点 序 列 < £ 工= 1「间隔相同的间断时点:两次平均I间断时点《,、 间隔不相等的间断时点:加权两次平均( 1 )时期序列计算序时平均数n> ' =——n【 例 题 • 单选题】该地区1 9 9 0〜1 9 9 8 年钢材年均使用量为( ) A. 1 72 6 吨年份1 9 9 01 9 9 11 9 9 21 9 9 31 9 9 41 9 9 51 9 9 61 9 9 71 9 9 8使用量1 3 1 61 53 91 56 11 76 51 72 61 9 6 01 9 0 22 0 1 32 4 4 6B. 1 750 . 6 吨C . 1 8 0 3 . 1 吨D . 1 8 4 6 . 7 吨『 正确答案』C『 答案解析』(1 3 1 6 + 1 53 9 + 1 56 1 + 1 76 5+ 1 72 6 + 1 9 6 0 + 1 9 0 2 + 2 0 1 3 + 2 4 4 6 ) / 9 = 1 8 0 3 . 1 (吨)( 2 )由时点序列计算序时平均数。

      ★连续时 点 分为两种情形:① 资料逐日排列且每天登记, 采 用 简单算术平均数的方法计算:ny =——n②资 料 登 记 的 时 间 单 位 仍 然 是1天 ,但实际上只在指标值发生变动时才记录一次此时需采用加权算术平均数的方法 计 算 序 时 平 均 数 , 权数是每一指标值的持续天数日期6 . 16 . 26 . 36 . 46 . 56 . 6库存量4 9523 92 94 33 8n工还Ji=l【 示 例 】某中 商 品6月份的库存量记录如下:日期1〜45〜78〜1 31 4 〜2 ()2 1 〜2 32 4 〜2 82 9 〜3 0库存量4 9523 92 94 33 851该 商 品6月份的平均日库存量为:-49x4+52x3+39x6+29x7+43x3+38x5+51x2y =---------------------------------------------------------------4+3+6+7+3+5+24 4 0 ( 台 )★间断时 点 分为两种情形:.y :+y , , y / y3, , y「y .、 , 一 2 2 2①每隔一定的时间登记一次,每次登记的间隔相等。

      间断相等的间断时点序列序时平均数的计算思想: “ 两 次 平 均 ”:先求各个时间间隔内的平均数,再对这些平均数进行简单算术平均 例 题 • 单选题】某 企 业 职 工 人 数 资 料 ( 单位:人 )如下:该 企 业3〜6月 份 平 均 职 工 人 数 为 ()A. 1 50 0 人B. 1 4 0 0 人时间3月3 1日4月3 0日5月3 1日6月3 0日职工人数1 4 0 01 50 01 4 6 01 4 2 0 C. 1445 人D. 1457 人『 正确答案』D『 答案解析』本题考查间隔相等的间断时点序列序时平均数的计算九+ 匕w2 2 - 2y=---------------------------1 4 0 0 4 - 1 50 0 1 50 0 + 1 4 6 0 1 4 6 0 + 1 4 2 0- - - - - - - - -+ _ + ,r 2 2 23= 1 4 57②每隔一定的时间登记一次,每次登记的间隔不相等 2 2 - 2 ”y _ n-l取hi间隔不相等的间断时点序列序时平均数的计算也采用“ 两次平均”的思路, 且第一次的平均计算与间隔相等的间断序列相同;进行第二次平均时,由于各间隔不相等,所以应当用间隔长度作为权数,计算加权算术平均数。

      例 题 •单选题】在序时平均数的计算过程中,与间隔相等的间断时点序列序时平均数计算思路相同 的 是 ( )A.间隔不相等的间断时点序列序时平均数B.时期序列序时平均数C.资料逐日登记且逐日排列的连续时点序列序时平均数D.只在指标值发生变动时才记录一次的连续时点序列序时平均数『 正确答案』A『 答案解析』二者都采用“ 两次平均”的思路 例 题 •单选题】某行业2000年至2008年的职工数量( 年底数)的记录如下:年份2000 年2003 年2005 年2008 年职工人数( 万人)1000120016001400则该行业2000至 2008年平均每年职工人数为( )万人A. 1300B.1325C. 1333D. 1375『 正确答案』B『 答案解析』平均职工人数=[(1000+1200) 4-2X3+ (1200 + 1600) + 2X 2+ (1600+1400)4-2X3] 4-8= 1325 (万 人 ) 2 . 相对数或平均数时间序列序时平均数的计算计算方法:分别求出分子指标和分母指标时间序列的序时平均数,然后进行对比例如,根据下表计算我国2 0 0 8 年至2 0 1 3 年第三产业从业人员数占总从业人员数比重的年平均数。

      我国2 0 0 8〜2 0 1 3 年从业人员数( 年底数)年份2 0 0 82 0 0 92 0 1 02 0 1 12 0 1 22 0 1 3从业人员数6 55546 6 3 736 71 9 96 79 4 76 8 8 506 9 6 0 0其中,第三产业( 万人)1 2 9 791 4 0 711 54 561 6 8 511 79 0 11 8 3 75第三产业所占比重( % )1 9 . 8 02 1 . 2 02 3 . 0 02 4 . 8 02 6 . 0 02 6 . 4 01 2 9 79 + 1 4 0 71 + 1 4 0 71 + 1 54 56 + 1 54 56 + 1 6 8 51 + 1 6 8 51 + 1 79 0 1 + 1 79 0 1 + 1 8 3 752 - - - - - - - 2 - - - - - - - - - - - -2 - - - - - - - - - - - -2 - - - - - - - - - - - -2= 1 59 9 1 . 2 (万人)6 5554 + 6 6 3 73 6 6 3 73 + 6 71 9 9 6 71 9 9 + 6 79 4 7 6 79 4 7 + 6 8 8 50 6 8 8 50 + 6 9 6 0 0- - - - - - - - - - - - - - + - - - - - - - - - - - - - -+ - - - - - - - - - - - - - -+ - - - - - - - - - - - - - -+ - - - - - - - - - - - - - -6 . 2 2 2 2 2= 6 758 9 . 2 (万人)1 59 9 1 . 2 4 - 6 758 9 . 2 = 2 3 . 6 6 %即我国2 0 0 8 年至2 0 1 3 年第三产业从业人员数占总从业人员数的年平均比重为2 3 . 6 6 %«( 三)增长量与平均增长量1 . 增长量( 1 )增长量:报告期发展水平与基期发展水平之差,反映报告期比基期增加( 减少)的绝对数量。

      增长量= 报告期水平一基期水平( 2 )根据基期的不同分为:逐期增长量和累计增长量逐期增长: △i= y i—y i- i累计增长:△ , = L 一力两者关系:△1 = y i—y o = S ( y i —y . - i )累计增长量等于相应时期逐期增长量之和 例 题 • 单选题】在时间序列的水平分析中,报告期水平与前一期水平的差是( )A . 累计增长量B. 逐期增长量C . 平均增长量D . 定基增长量『 正确答案』B『 答案解析』 逐期增长量=报告期水平一报告期前一期水平; 累计增长量=报告期水平一最初水平2. 平均增长量平均增长量: 时间序列中逐期增长量的序时平均数, 它表明现象在一定时段内平均每期增加( 减少)的数量展 增长量之和RG f ) =期数 n N -\式中,n表示逐期增长量个数,N表示时间序列项数 【 例 题 • 多选题】关于增长量的说法,正确的有( )A.增长量是报告期发展水平与基期发展水平之差B.累计增长量是报告期水平与某一固定时期水平之差C.逐期增长量是报告期水平与前一期水平之差D.同一时间序列中,累计增长量等于相应时期内逐期增长量的乘积E.平均增长量是时间序列中逐期增长量的序时平均数『 正确答案』ABCE『 答案解析』本题考查增长量与平均增长量。

      选项D错误,同一时间序列中,累计增长量等于相应时期逐期增长量之和 例 题 •单选题】平均增长量是时间序列中( )的序时平均数A.累计增长量B. 报告期水平与某一固定时期水平( 通常是时间序列最初水平)之差C. 逐期增长量D.报告期发展水平『 正确答案』C『 答案解析』平均增长量是时间序列中逐期增长量的序时平均数 例 题 •单选题】某商场2009〜2013年商品销售额( 单位:百万元)如下:年份20092010201120122013销售额35. 040.044.049.955.0该商场2009〜2013年商品销售额的平均增长量为( )百万元A. 5B.4C. 44D. 3『 正确答案』A『 答案解析』平均增长量=[( 4 0 -3 5 ) + ( 44—40) + ( 4 9 .9 -4 4 ) + ( 5 5 -4 9 .9 ) ] / ( 5 - 1 )=5知识点三:时间序列的速度分析( 一)发展速度与增长速度1 . 发展速度含义:报告期水平已发展到基期水平的几分之几或若干倍期 水 平由于基期选择的不同分为:( 1)定基发展速度:报告期水平与某一固定时期水平( 通常是最初水平)的比值。

      a = £乂(2)环比发展速度:报告期水平与其前一期水平的比值b =』 -,Yi-x ( 3 )两者之间关系:①定基发展速度等于相应时期内各环比发展速度的连乘积:X n .A x X lx ……X -v Yi 小②两个相邻时期定基发展速度的比率等于相应时期的环比发展速度:【 例 题 • 单选题】时间序列分析中,报告期水平与某一固定时期水平的比值是( )A . 环比发展速度B. 环比增长速度C . 定基发展速度D . 定基增长速度『 正确答案』C『 答案解析』本题考查发展速度定基发展速度是报告期水平与某一固定时期水平( 通常是最初水平 )的比值 例 题 •单选题】以2010年为基期,我国2012、2013 年广义货币供应量的定基发展速度分别是13 7 . 4% 和 16 4. 3 % , 则 2013 年与2012年相比的环比发展速度是( )A . 16 . 4%B. 19 . 6 %C . 26 . 9 %D . 119 . 6 %『 正确答案』D『 答案解析』2013 年与2012年的环比发展速度= 2013 年定基发展速度+ 2012年定基发展速度= 16 4. 3 % + 13 7 . 4% = 119 . 6 %2. 增长速度( 1)含义:报告期增长量与基期水平的比值,表明报告期水平比基期增长( 降低)了若干倍( 百分之几)。

      2 )定 基 增 长 速 度 = 左 % = 可 一 1y 3 )环比增长速度= 纥 左 1 = 0 -1y.-i【 例 题 •多选题】 ( 2020年)关于发展速度与增长速度的说法,正确的有( )A . 两个相邻时期定基发展速度的比率等于相应时期的环比发展速度B. 增长速度没有定基与环比之分C . 发展速度是以相对数形式表示的两个不同时期发展水平的比值D . 定基发展速度等于相应时期内各环比发展速度的连乘积E. 由于基期选择的不同,发展速度有定基与环比之分 『 正确答案』ACDE『 答案解析」 发展速度是以相对数形式表示的两个不同时期发展水平的比值 由于基期选择的不同,发展速度有定基与环比之分定基发展速度等于相应时期内各环比发展速度的连乘积 两个相邻时期定基发展速度的比率等于相应时期的环比发展速度增长速度是报告期增长量与基期水平的比值 ,由于基期选择的不同,增长速度也有定基与环比之分,选 项B错误,选 项ACDE正确 例 题 •单 选题】已知某地区2011 — 2015年社会消费品零售总额的环比增长速度分别为4%、6%、9%、10%,则这一时期该地区社会消费品零售总额的定基增长速度为( )。

      A. 4%X6%X9%X10%B. ( 4%X6%X9%X10%) +1C. ( 104%X106%X109%X110%) - 1D. 104%X106%X109%X110%『 正确答案』C『 答案解析』定基增长速度=定基发展速度-1= 环比发展速度连乘积一 1=( 1+ 环比增长速度)连乘积一1=( 104%X106%X109%X110%) - 1( -)平均发展速度与平均增长速度1 . 平均发展速度:一定时期内各期环比发展速度的序时平均数各时期对比的基础不同, 所以不能采用一般序时平均数的计算方法目前计算平均发展速度通常采用几何平均法几何平均法也称水平法即:其中,b i= y ,/y -, n表示环比发展速度的时期数相应时期内各环比发展速度的连乘积等于定基发展速度2 . 平均增长速度:反映现象在一定时期内逐期增长( 降低)变化的一般程度3 . 平均发展速度与平均增长速度的关系:平均增长速度=平均发展速度- 1【 例 题 •单选题】我 国2010-2015年人均国内生产总值分别为:3.1、3.6、4.0、4.3、4. 7和5. 2( 单位:万元/ 人)我 国2010-2015年人均国内生产总值的平均增长速度算式是( )。

      1 3 . 6 4. 0 4. 3 4. 7 5 . 2、C . - x (一 + — + — + — + — )5 3 . 1 3 . 6 4. 0 4. 3 4. 71 3 . 6 4. 0 4. 3 4. 7 5 . 2、,D . - X ( - - +- - - +- - - +- - - +- - - ) - 15 3 . 1 3 . 6 4. 0 43 4. 7『 正确答案』B『 答案解析』本题考查平均增长速度平均增长速度=平均发展速度- 1 ( 三)速度的分析与应用1 . 当时间序列中的指标值出现0 或负数时 , 不宜计算速度2 . 速度指标的数值与基数的大小有密切关系 在环比增长速度时间序列中, 各期的基数不同, 因此,运用这一指标反映现象增长的快慢时,往往要结合水平指标的分析才能得出正确结论 示例】甲企业利润增长速度20% , 乙企业利润增长速度40悔 甲企业每增长1% 增加利润额5万,乙企业每增长1% 增加利润额0. 6万3 .“ 增 长 1% 的绝对值”:速度每增长一个百分点而增加的绝对数量反映同样的增长速度,在不同时间条件下所包含的绝对水平。

      增长1琳 ]绝对值=环k日曾长速度y ]»、-1 一 Z-1上—X 100万y-.i【 例 题 •单选题】我国国内旅游总花费2018年为5127 8. 3 亿元,2017 年为4 5660. 7 亿元,则 2018年国内旅游总花费的增长1% 绝对值为( )亿元A . 512. 7 83B . 5127 8. 3C . 4 56. 607D . 4 65. 7 06『 正确答案』C『 答案解析』本题考查增长设的绝对值4 5660. 7 +100=4 56. 607 例 题 • 多选题】关于时间序列的说法,正确的有( )A . 同一时间序列中,累计增长量等于相应时期逐期增长量之和B . 定基发展速度等于相应时期内各环比发展速度的连乘积C . 平均增长量等于累计增长量与逐期增长量之比D . 定基增长速度等于相应时期内各环比增长速度的连乘积E . 两个相邻时期定基发展速度的比率等于相应时期的环比发展速度『 正确答案』A B E『 答案解析』 本题考查时间序列 平均增长量是时间序列中逐期增长量的序时平均数, 选项C错误定基发展速度等于相应时期内各环比发展速度的连乘积, 定基增长速度和环比增长速度的关系, 需要通过定基发展速度和环比发展速度的关系来转换,选项D说法错误。

      例 题 • 多选题】在进行时间序列的速度分析时,不宜计算速度的情况包括( )A . 序列中各期指标值大小差异很大B . 序列中指标值出现0C . 序列中各期指标值均为绝对数D . 序列中指标值出现负数E . 序列中指标值存在极端值『 正确答案』B D『 答案解析』在应用速度分析实际问题时,须防止误用乃至滥用的现象应注意:首先,当时间序列中的指标值出现 或负数时,不宜计算速度其次,速度指标的数值与基数的大小有密切关系 知识点四:平滑预测法( 一)平滑法概述目的消除时间序列的不规则成分所引起的随机波动适用情形 适用于平稳时间序列的预测,即没有明显的趋势、循环和季节波动的时间序列优点简单易用,对数据的要求最低,通常对于近期的预测具有较高的精度具体方法 移动平均法、指数平滑法( 二)移动平均法移动平均法:使用时间数列中最近k期数据值的平均数作为下一期的预测值短 丫 山 + 葭 、 ,•…+Y i+ K其中, 工就是对时间序列的匕预测结果;k为移动间隔( l < k < t )【 示例】某纺织品公司近年棉布销售量如下表,请用一次移动平均法预测2018年的棉布销售量 单位:万米)年份销量预测销量20 1 51 0 3 2102720 1 61 0 1 51 0 3 120 1 71 0 1 01 0 2220 1 8?20 1 8 年预测销量=( 1 0 1 0 + 1 0 1 5 + 1 0 3 2) / 3 = 1 0 1 9 ( 万米)( 三)指数平滑法指数平滑法:利用过去时间序列值的加权平均数作为预测值,即使得第t + 1 期的预测值等于第t期的实际观察值与第t期预测值的加权平均值。

      ( 单选)这种方法的特点:观测值离预测时期越久远,其权重也变得越小,呈现出指数下降,因而称为指数平滑R + 尸 a Y< + ( 1 — a ) Ft其中,F为指数平滑预测值;Y 为实际观测值; 为平滑系数( 权重),取值范围【 示例】 某种产品销售量的平滑系数为0 . 4 , 20 1 7 年实际销售量为3 1 万件, 预测销售量为3 3 万件,则 20 1 8 年预测销售量是多少?20 1 8 年预测销售量= 3 1 X0 . 4 + 3 3 X ( 1 - 0 . 4 )= 3 2. 2 ( 万件)【 例题•单选题】 20 1 1 年一20 1 6 年我国工业生产者出厂价格指数分别为1 0 6 . 0 、 9 8 . 3 、 9 8 . 1 、 9 8 . 1 、9 4 . 8 、9 8 . 6 , 选取移动间隔K = 3 , 应用移动平均法预测20 1 7 年工业生产者出厂价格指数,则预测值为( )A . 9 9 . 0B . 9 8 . 3C . 9 6 . 7D . 9 7 . 2『 正确答案』D『 答案解析』本题考查移动平均法 ( 9 8 . 1 + 9 4 . 8 + 9 8 . 6 ) / 3 = 9 7 . 2。

      例 题 •单选题】如果以Y, 表示第t 期实际观测值、F , 表示第t期指数平滑预测值、a表示平滑系数,则指数平滑预测法的计算公式为( ) A. Ft+ I= a Yt+i+ ( 1 - a ) FtB. Ft+ I= a Yt+ ( 1 - a ) BC.F,+尸 a (F,+Yt)D. K+尸 a Ft『 正确答案』B『 答案解析』本题考查指数平滑法指数平滑法是利用过去时间序列值的加权平均数作为预测值,即使得第t + 1期的预测值等于第t 期的实际观察值与第t 期预测值的加权平均值其基本计算公式为:Ft+1- a Y,+ ( 1 - a ) F,点Bl张宁r时间序列时期绝对数- - - - - - - -时点相对数平均数发 展 水 平 最初、最末、中间数绝 对 数 「逐日登记J水平分析平均发展水平二时 点 数C间断时点勺间断相同间断不同相对数、平 均 数 先平均再对比逐期增长增 长 量 累计增长* 关系平 均增长量 逐期增长量的平均定基发 展 速 度 , 环比* 关系平均发展速度 几何平均—速 度 分 析C增 长 速 度 发展速度-1平均增长速度 平均发展速度-1点睛张宁速度分析注意。

      0和负数、增长1 %的绝对值移 动 平 均 最近K期平均值预测下一期平 滑 预 测C指 数 平 滑 t实际值与预测值加权平均,预测t + 1 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.