
2015年中级统计师讲义—统计业务知识之统计方法.pdf
84页第一章统计和数据本章主要内容:l统计的含义2定性与定量数据、观测与实验数据3.数据的直接与间接来源、搜集数据的方法重点:l统计分析数据的方法:描述统计与推断统计2数据的类型:定性与定量变量、观测与实验数据3数据的来源:直接来源与间接来源4搜集数据的方法:普查、抽样调查、统计报表、重点调查、典型调查难点:l描述与推断统计的区别2定性变噩与定量变晕的区别3典型抽样的形式第一节统计的含义知识点一:什么是统计l含义统计是用来处理数据的,关千数据的一门学问按大百科全书的定义:统计学是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法例题多选题下列关千统计学的描述,正确的有() a.统计学是用来处理数据的,是关千数据的一门学问b.统计学是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法C.统计分析数据的方法大体上可分为描述统计和推断统计两大类d.在现代社会中,儿乎所有领域都会应用到统计学e.统计的应用范围很广泛,有时也会被滥用答案:abcde解析:统计学是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法统计分析数据分描述统计和推断统计统计是适用于所有学科领域的通用数据分析方法,是一种通用的数据分析语言。
2.种类统计分析数据的方法分两种:描述统计和推断统计描述统计:是研究数据搜集、处理和描述的统计学方法其内容包括如何取得研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合、概括与分析,得出所关心的数据特征推断统计:是研究如何利用样本数据来推断总体特征的统计学方法,内容包括参数估计和假设检验两大类例题单选题研究如何利用样本数据来推断总体特征的统计学方法是()a.描述统计b.理论统计C.推断统计d.应用统计答案:C 解析:推断统计是研究如何利用样本数据来推断总体特征的统计学方法,内容包括参数估计和假设检验两大类例题判断题描述统计是研究如何利用样本数据来获得总体特征的统计学方法答案:错解析:描述统计是研究数据搜集、处理和描述的统计学方法知识点二:统计的应用一、统计的应用领域统计是适用千所有学科领域的通用数据分析方法,是一种通用的数据分析语言无论是在社会科学领域,还是在自然科学领域,进行某个课题的研究时,为使观点与结论具有事实依据和说服力,必须根据调查研究或实验取得的统计数据来说明问题,这需要运用科学地统计方法来进行二、统计的误用与滥用统计常常被人们有意或无意地滥用如,错误的统计定义、错误的图表提示、一个不合理的样本、数据的遗漏或逻辑错误等。
这些误用有些是常识性的,有些是技术性的,有些则是故意的作为从数据中寻找事实的统计,却被有人变成了歪曲事实的工具例题判断题统计是适用于所有科学领域的通用数据分析方法答案:正确解析:统计是适用于所有学科领域的通用数据分析方法,是一种通用的数据分析语言第二节数据类型知识点一:变量与数据变数或变量:是指没有固定的值,可以改变的数它们的特点是从一次观察到下一次观察会出现不同的结果数据:把观察到的结果记录下来就是数据统计数据就是统计变量的具体表现例题判断题变量是数据的具体体现答案:错误解析:数据是变量的具体表现知识点二:数据类型一、定性变量(数据)与定量变量(数据)(一)定性变量:反映职业”、“教育程度”等现象的属性特点的变量定性变晕的特点:它只能反映现象的属性特点,而不能说明具体星的大小和差异定性变呈的分类:分类变噩与顺序变噩分类变量:没有量的特征,只有分类特征这种只反映现象分类特征的变量又称分类变噩分类变噩的观测结果就是分类数据说明事物类别的一个名称如“性别”就是一个分类变量分类变量没有数值特征,所以不能对其数据进行数学运算顺序变量:如果类别具有一定的顺序,如,“教育类别,这样的变量称为顺序变噩,相应的观察结果就是顺序数据。
说明事物有序类别的一个名称,这类变噩的具体表现就是顺序数据顺序数据之间虽然可以比较大小,却无法计算相互之间大小、高低和优劣的距离这样的数据仍然用来表示事物在性质上的差异,而不能用来反映事物在数量上的差异二)数值(定晕)变量:反映“天气温度”、“月收入”等变量可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测噩出来具体大小和差异这些变噩就是定量变量也称数值变量,定量变量的观察结果成为定量数据是说明事物数字特征的一个名称定性变量与定量变量的区别:l分类变釐没有数值特征,所以不能对其数据进行数学运算分类数据只能用来区分事物,而不能用来表明实物之间的大小、优劣关系2顺序变量比分类变量向前进一步,它不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系显然,顺序数据的功能比分类数据要强一些,对事物的划分也更精细一些但顺序数据的数据之间虽然可以比较大小,却无法计算相互之间的大小、高低或优劣的距离只是反映事物在性质上的差异,而不能用来反映事物在数量上的差异因此,从本质上,顺序数据仍然是定性数据中的一种3数值型数据作为统计研究的主要资料,其特征在千它们都是以数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差,而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差。
其计量精度远远高于定性数据在统计学研究中,对数值型数据的研究是定噩分析的主要内容从上述三种数据的基本特点可以看出,这三类数据对事物的描述是由定性到定量、由低级到高级,从粗略到精细在统计研究中,需要明确各种数据所适用的统计方法,正确的选择和应用,这是正确进行统计研究的基本要求例题单选题下列变量是定性变量的是() a.年龄b.职业c.居民的受教育年限d.月收入答案:b 解析:定性变噩是反映“职业”、“教育程度”等现象的属性特点的变蜇,不能说明具体量的大小和差异例题单选题为了便千数据分析,人们常用数字l表示男性,2表示女性,这个数字l和2()a.具有数量上的差异b.具有实际数字含义C.只是一个编号d.可以进行运算答案:C 解析:这种变量是分类变量,没有量的特征,只有分类特征例题单选题若产品质量由高到低划分为三个级别:1级、2级、3级,则下列说法中正确的是()a. 1级品的质量是2级品的两倍b. 2级品的质星是1级品的两倍c.产品质量级别是顺序数据d.产品质量级别是定量数据答案:C 解析:产品质噩级别是定性变噩,只是反映产品之间在质星上的性质差异,却无法计算相互之间大小、高低和优劣的距离例题单选题下列关千变量数据的说法错误的是()。
a.分类数据只能用来区分事物,不能用来表明事物间的大小、优劣b.顺序数据具有数值特征,可以用千反映事物在数量上的差异c.数值型数据的计量功能要大千分类数据和顺序数据d.在统计学研究中,对数值型数据的研究是定量分析的主要内容答案:b 解析:顺序数据的数据之间虽然可以比较大小,却无法计算相互之间的大小、高低或优劣的距离只是反映事物在性质上的差异,而不能用来反映事物在数量上的差异二、观测数据和实验数据按获取数据的方法不同,可分为观测数据和实验数据观测数据可能是全而数据也可能是样本数据(局部),实验数据一般都是样本数据1观测数据观测数据是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束在社会经济问题研究中,观测是取得数据最主要的方法2.实验数据实验数据一般是在科学实验环境下取得的数据在实验中,实验环境是受到严格控制的,数据的产生一定是某一约束条件下的结果在自然科学研究中实验的方法应用非常普遍例题单选题根据获取方法不同,数据可分为观测数据和()a.描述数据b.实验数据c.推断数据d.分析数据答案:b 解析:按获取数据的方法不同,可分为观测数据和实验数据第二章数据描述重点:l定性数据和定量数据的图表展示方法2标准的统计表的构成3定性数据和定量数据的数字特征难点:l定性数据和定噩数据的图表展示的区别2定性数据和定量数据的数字特征的区别知识点一:定性数据的图表展示方法定性数据包括分类数据和顺序数据,它们的图表展示方法基本相同。
通常可以用频数分布表和图形来描述一生成频数分布表定性数据本身是对事物的一种分类,因此,只要先把所有的类别都列出来,然后统计出每一类别的频数,就是一张频数分布表频数分布表中落在某一特定类别的数据个数称为频数频数分布包含了很多有用的信息,通过它可以观察不同类型数据的分布情况频数分步表一般是用excel生成例题单选题在某一特定类别中的数据个数称为()a.均值b.众数c.标准差d频数答案:d 解析:频数分布表中落在某一特定类别的数据个数称为频数频数分布包含了很多有用的信息,通过它可以观察不同类型数据的分布情况二定性数据的图形表示定性数据(分类数据和顺序数据)可以描绘出它们各类的比例,常用饼图和条形图表示一 )饼图饼图又称圆饼图、圆形图等,它是利用圆形及圆内扇形而积来表示数值大小的图形饼图主要用千总体中各组成部分所占比重的研究二)条形图条形图是用宽度相同的条形的高度或长度来表述数据多少的图形,用于观察不同类别数据的多少或分布情况三)环形图饼图只能显示一个变量(如年龄变噩)各部分所占的比重如果我们想比较不同变量之间的结构差异,就可以通过环形图来实现首先,利用产生频数表的方法先做出分性别的年龄分布表;然后,根据上表再绘制出环形图。
例题单选题条形图是利用宽度相同的条形的()来表述数据多少的图形a.面积b.高度或长度c.频数d.类别答案:b 解析:条形图是用宽度相同的条形的高度或长度来表述数据多少的图形,用千观察不同类别数据的多少或分布情况例题单选题若需要比较不同变量之间的结构差异,可采用的图形为()a.频数分布图b.条形图c.饼图d.环形图答案:d 解析:饼图只能显示一个变量(如年龄变量)各部分所占的比重如果我们想比较不同变噩之间的结构差异,就可以通过环形图来实现例题单选题饼图是利用圆形及圆内扇形的()来表示数值大小a.面积b.弧线长度c.角度d.颜色答案:a 解析:饼图又称圆饼图、圆形图等,它是利用圆形及圆内扇形面积来表示数值大小的图形饼图主要用千总体中各组成部分所占比重的研究第二节用图表展示定量数据知识点一:生成频数分布表定性数据的图示表示方法,也都适用千定噩数据但定噩数据还有一些特定的图示方法,它们并不适用千定性数据生成定噩数据的频数分布表时,首先是将数据进行分组,然后再统计出各组别的数据频数即可定量数据频数分布表的生成过程:首先,要对数据进行分组其次,要确定组距所谓组距是指每个组变量值中的最大值与最小值之差。
每组最大值称为该组上限,最小值称为该组下限则组距等千上限与下限之差,即组距上限下限例题单选题生成定昼数据的频数分布表时,首先要对数据()a.分类b确定组距C.分组d.确定组频数答案:C 解析:生成定量数据的频数分布表时,首先是将数据进行分组,然后再统计出各组别的数据频数即可在确定组距是,一般应掌握的原则:一是要考虑各组的划分是否能区分总体内部各个组成部分的性质差别如果不能正确反映各部分质的差异,必须重新分组二是要能准确地清晰地反映总体单位的分布特征在确定组距时,在研究的现象变动比较均匀的清况下,可以采用等距分组;而当研究的现象变动很不均匀时,例如急剧的增长或急剧的下降,波动的幅度很大时,则一般采用不等距分组在实际工作中,要结合实际情况确定各组的组距例题判断题能够对统计总体进行分组,是由统计总体中的各个单位所具有的同质性特点决定的答案:错误解析:在确定组距是,一般应掌握的原则:一是要考虑各组的划分是否能区分总体内部各个组成部分的性质差别如果不能正确反映各部分质的差异,必须重新分组最后,统计出各组的频数及频数分布表在统计各组频数时,恰好等于某一组的组限时,则采取上限不在内的原则,即将该频数计算在与下限相同的组内。
例题单选题在统计分组中,如果某一数值恰好等千某一组的组限时,则采取()a.下限不在内的原则b.上限不在内的原则C.上下限都可以在内。
