市场营销调研第十三讲.ppt
47页第13讲 非参数检验本讲主要内容•13.1 非参数检验概述•13.2 单样本非参数检验•13.3 多样本非参数检验参数检验(回顾)•分类–参数检验•假设总体分布已知,根据样本的参数推断总体的参数–非参数检验•假设总体分布未知,根据样本的分布推断总体的分布•参数检验•单样本t检验•两独立样本t检验•两配对样本t检验13.1 非参数检验概述•假设总体分布未知,根据样本的分布推断总体的分布•由于种种原因,人们往往无法对总体分布形态做简单假设,但却又希望能从样本数据中获得信息•分类:1>单样本非参数检验 2>多样本非参数检验13.2 单样本非参数检验•卡方检验•二项分布检验•K-S检验•游程检验•四种单样本非参数检验方法的比较•原理–检验目标:根据样本数据推断总体的分布与期望分布或某一理论分布是否有显著差异–零假设 :样本来自的总体其分布形态与期望分布或某一理论分布无显著差异;–统计量–根据统计量 的值查表得到对应的相伴概率值 ;–作出判断:•当 ,拒绝•当 ,接受13.2.1 卡方检验13.2.1 卡方检验•SPSS操作步骤–打开卡方检验对话框•AnalyzeNonparametric TestsChi Square–选择分析变量–确定理论分布范围–确定分布的理论值–选择输出结果的形式及缺失值的处理方法–输出检验结果13.2.1 卡方检验•实例–医学家研究心脏病人猝死人数与日期的关系时发现,一周之中星期一猝死人数较多,其它日子则基本相同。
每天比例近似为: 2.8:1:1:1:1:1:1 根据收集到的资料,推断其总体分布是否与上述理论分布相吻合•二项分布–某一变量的取值是两类的,若一类出现的概率是p,则另一类出现的概率是1-p,这种分布称为二项分布13.2.2 二项分布检验•原理–检验目标:根据样本数据推断总体的分布与指定的某个二项分布是否有显著差异–零假设 :样本来自的总体其分布形态与期望分布或某一理论分布无显著差异;–统计量–根据统计量 Z 的值查表得到对应的相伴概率值 ;–作出判断:•当 ,拒绝•当 ,接受13.2.2 二项分布检验13.2.2 二项分布检验•SPSS操作步骤–打开二项分布检验对话框•AnalyzeNonparametric TestsBinomial–选择分析变量–确定二分值–确定检验概率的值–选择输出结果的形式及缺失值的处理方法–输出检验结果13.2.2 二项分布检验•实例–为了验证某批产品的合格率是否为90%,现从该产品中随机抽取23个样品进行检测并得到检测结果数据,期中1表示合格,0表示不合格,采用二项检验方法检验•原理–检验目标:根据样本的分布来确定总体是否服从某种分布。
–零假设 :样本来自的总体其分布形态服从给定的分布;–统计量T–根据统计量T的值查表得到对应的相伴概率值 ;–作出判断:•当 ,拒绝•当 ,接受13.2.3 K-S检验13.2.3 K-S检验•SPSS操作步骤–打开K-S检验对话框•AnalyzeNonparametric Tests1-sample K-S–选择分析变量–确定要检验的分布(4个选项)–选择输出结果的形式及缺失值的处理方法–输出检验结果13.2.3 K-S检验•实例–周岁儿童身高总体的分布检验;–储户存(取)款金额总体的分布检验•原理–检验目标:根据样本数据对总体某变量的取值是否随机进行检验或检验两个总体的分布是否相同–零假设 :两个总体的分布无显著性差异–统计量–根据统计量 的值查表得到对应的相伴概率值 ;–作出判断:•当 ,拒绝•当 ,接受13.2.4 游程检验13.2.4 游程检验•SPSS操作步骤–打开游程检验对话框•AnalyzeNonparametric TestsRuns–选择分析变量–指定分割点–选择输出结果的形式及缺失值的处理方法–输出检验结果13.2.4 游程检验•实例–为了检验某耐压设备(电缆)在某段时间内工作是否持续正常,测试并记录下该时间段内各个时间点上的设备耐压数据。
如果耐压数据的变动是随机的,可以认为工作正常,否则认为该设备有不能正常工作的现象13.2.5 四种检验方法的比较•前三种方法属于拟和性检验,可检验样本来自的总体是否服从某种理论分布–卡方检验一般要求待检验样本有较大的样本容量,较适合一个因素的多项分类的数据分析–二项分布检验只能作二项分布检验–单样本K-S检验较适合于连续型数据的分析13.2.5 四种检验方法的比较•游程检验即可用来检验样本的随机性,也可以用来检验两个总体的分布是否相同,它与个案的排序有关13.3 多样本非参数检验•两独立样本非参数检验•多独立样本非参数检验•两相关样本非参数检验•多相关样本非参数检验13.3.1 两独立样本非参数检验•检验目标–根据两独立样本之间的差异大小来确定两个总体是否相等•SPSS操作步骤–打开两独立样本检验对话框•AnalyzeNonparametric Tests2 Independent-Samples–选择分析变量–确定分组变量–确定分组标志–确定检验方法–选择输出结果的形式及缺失值的处理方法–输出检验结果13.3.1 两独立样本非参数检验•实例–某工厂用甲乙两种不同的生产工艺生产同一种产品,希望检验两种工艺下产品的使用寿命是否相同。
工艺使用寿命样本值甲675,682,692,679,669,661,693乙662,649,672,663,650,651,646,65213.3.2 多独立样本非参数检验•检验目标–根据多个独立样本之间的差异大小对多个总体之间的差异进行检验;或将一个总体进行多项分类后对多个类别间的差异进行检验•SPSS操作步骤–打开多独立样本检验对话框•AnalyzeNonparametric TestsK Independent-Samples–选择分析变量–确定分组变量–指定分组变量值的范围–确定检验方法–选择输出结果的形式及缺失值的处理方法–输出检验结果13.3.2 多独立样本非参数检验•实例–希望对北京、上海、成都、广州四个城市的周岁儿童的身高进行比较分析,次用多独立抽样方式获得四组独立样本城市身高样本数据北京79,75,78,76,72上海72,71,74,74,73成都76,78,78,77,75广州70,72,71,71,6913.3.3 两配对样本非参数检验•检验目标–根据样本数据对它们来自的两配对总体的分布进行推断•SPSS操作步骤–打开两配对样本检验对话框•AnalyzeNonparametric Tests2 Related Samples–选择分析的配对变量–确定检验方法–选择输出结果的形式及缺失值的处理方法–输出检验结果13.3.3 两配对样本非参数检验•实例–“贫困调查”中的“满意度1”是贫困人口获得低保以前的生活满意度测量结果, “满意度2”是贫困人口获得低保以后的生活满意度测量结果。
检验获得低保前后的生活满意度是否有变化13.3.4 多配对样本非参数检验•检验目标–根据样本数据对它们来自的多配对总体的分布进行推断•SPSS操作步骤–打开多配对样本检验对话框•AnalyzeNonparametric TestsK Related Samples–选择分析的相关变量族–确定检验方法–选择输出的统计结果13.3.4 多配对样本非参数检验•实例–“休闲调查”中的“”、“传呼机”、“”、“机”、“互联网”是被调查者对这五种现代通讯工具在生活中的重要性的评分现用多个相关样本检验的方法,来分析这五种通讯工具的重要性有无差异上机实践•主题:非参数检验–熟练掌握使用SPSS进行统计分析的操作方法 •练习–SPSS电子教材案例–小组期末社会调研项目补充练习•1.下列资料是某产品52周的订货量,若a=0.01,试检验该产品的周订货量是否服从正态分布18 20 22 27 25 19 22 27 26 25 29 24 25 19 23 25 28 20 26 28 21 30 17 24 25 15 20 31 29 33 25 24 19 20 22 15 35 28 24 21 27 26 38 34 15 19 34 35 25 28 24 20补充练习•2.某地方当局宣称该地区企业经理阶层月收入的中位数为5800元,为了验证这一说法是否正确,统计调查部门抽取了如下的一组样本数据资料,试在5%的显著性水平下,检验假设H0:Me<=5800, H1:Me>5800。
6000 5200 6300 4900 7200 5712 6505 5320 7210 4890 5800 6009 6100 5830 6000 7140 4850 5820 6600 7300 5180 6380 5900 5600 7000 6900 3800 4930 7000 6920 5420 4790 5400补充练习•3.从甲、乙两台机床加工的同一种产品中,各抽取一个样本进行检测,得到如下一组资料: 甲机床:15.0 14.5 15.2 15.5 14.9 15.3 15.8 14.2 14.9 15.4 乙机床:14.7 14.9 15.2 15.2 15.0 15.8 15.7 15.1 15.5 15.3 15.4 假定服从正态分布,通过秩和进行检验, 两台机床加工的产品是否服从同样的分 布(显著性水平为5%)。
补充练习•4.某公司的市场销售部门在9个不同的销售地区,同时用三种促销手段进行了促销宣传活动,为期一个月后,收到订单数据如下,问三种促销方式对销售的影响如何(显著性水平为5%)销售地区订单数(件)促销手段1促销手段2促销手段31380420550256038982033203658004530482660561459073064323814707258240268832977090197069120第13讲 方差分析本讲主要内容•13.1 方差分析概述•13.2 简单方差分析•13.3 平均数多重比较的方差分析 13.1 方差分析概述•概述–主要用于研究定类或定序变量与定距或定比变量之间的关系•定距或定比变量是分析变量(因变量)•定类或定序变量是影响因素变量(自变量)•定类或定序变量的取值被称为影响因素的几个水平–将影响因素变量分为控制变量与随机变量,方差分析就是分析控制变量的不同水平是否对分析变量产生了显著性影响13.1 方差分析概述•目的–当影响因素取不同水平时,被分析的变量是否有显著差异?•方法–比较各个类别的组内差异和类别之间的组间差异大小确定变量之间是否有关。
•结论–两变量相关:组间差异大而组内差异小–两变量不相关:组间差异小而组内差异大13.1 方差分析概述•前提–因变量在各个水平的分布必须服从正态分布,且具有等方差性•方差分析问题转换成研究不同水平下的各总体的均值有无显著性差异的问题•一元方差分析–作为影响因素的自变量只有一个,也称单因素方差分析•原理–原假设 在控制变量的不同水平下,各总体均值无显著性差异–判断因变量在各个水平上的等方差性(F检验)–选取F统计量进行检验,F服从(k-1, n-k)个自由度的F分布–根据相伴概率值,作出判断:•当 ,拒绝 ,控制变量的不同水平下,各总体均值存在显著性差异;•当 ,接受 ,控制变量的不同水平下,各总体均值无显著性差异;13.1 方差分析概述13.2 简单方差分析•操作方法–打开简单方差分析对话框•AnalyzeCompare MeansOne-Way ANOVA…–选择分析变量和影响因素变量–确定统计输出结果–输出简单方差分析结果13.2 简单方差分析•实例–在“休闲调查1”中以“文化程度”为影响因素,对“家月收入”进行简单方差分析。
13.3 平均数多重比较的方差分析•在简单方差分析的基础上做进一步的分析,进行具体各个类别之间的差异比较•操作方法–打开简单方差分析对话框•AnalyzeCompare MeansOne-Way ANOVA…–选择分析变量和影响因素变量–打开多重比较对话框–确定统计输出结果–输出平均数多重比较方差分析的结果13.3 平均数多重比较的方差分析•实例–在“休闲调查1”中以“文化程度”为影响因素,对“家月收入”进行多重比较的方差分析上机实践•主题:方差分析–熟练掌握使用SPSS进行统计分析的操作方法•练习–SPSS电子教材案例–小组期末社会调研项目–补充练习(下课前提交)补充练习•1、下表为某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者和非患者进行了用力肺活量(L)测定问三组石棉矿工的用力肺活量有无差别?石棉肺患者石棉肺患者1.81.41.52.11.91.71.81.91.81.82.0可疑患者可疑患者2.32.12.12.12.62.52.32.42.4非患者非患者2.93.22.72.82.73.03.43.03.43.33.5补充练习•2、教材P184单因素方差分析例题。
•3、教材P189思考题4。





