
SPSS数据分析教程第6章非参数.ppt
43页SPSS数据分析数据分析-第第6讲—《SPSS数据分析教程》主要内容 Ø非参数检验和参数检验的区别Ø各种非参数检验及其应用条件Ø单样本非参数检验方法及其结果的解释Ø独立样本非参数检验方法及其结果的解释Ø相关样本非参数检验方法及其结果的解释非参数检验简介 Ø参数检验方法检验的内容是总体分布的某些参数,例如均值,方差,比率等 Ø非参数检验主要用于不考虑被研究对象的总体分布,或对总体的分布不做任何事先的假定的检验Ø非参数检验的内容不是总体分布的某些参数,而是检验总体某些有关的性质,例如总体的分布位置、分布形状之间的比较,或者各样本所在总体是否独立等非参数检验方法的优点 Ø稳健性:因对总体分布的约束条件放宽,从而对一些离群值或极端值不至于太敏感Ø使用范围广:对数据的度量标准(或测量测度)无约束,定序数据、定量数据都可;部分数据缺失也可;小样本、分布未知样本、数据污染样本、混杂样本等都可以应用非参数方法非参数检验的应用范围Ø参数检验方法的条件不满足例如样本来自的总体不服从正态分布,T检验不适用,必须应用非参数方法来比较两个总体的中心趋势Ø研究定类变量和定序变量之间的关系SPSS非参数检验Ø新的用户界面统一了方法的选择,根据样本的个数来组织方法。
Ø非参数统计过程仍然保留了SPSS18以前的非参数检验的界面,称为“旧对话框”,它的输出仍然为传统的表格方式展现检验结果同时可以选择输出描述性统计量和四分位数,而新用户界面下没有Ø在非参数检验过程的对话框和帮助文档中,把以前熟悉的变量(Variable)称为字段(field)单样本非参数检验 ØSPSS的单样本非参数检验方法包括:Þ二项(分布)检验Þ卡方检验ÞKolmogorov-Smirnov检验 ÞWilcoxon符号检验Þ游程检验 卡方检验Ø卡方检验是一种常用的对总体分布进行检验的非参数检验方法Ø例如,医生研究心脏病人猝死人数与日期的关系,检验现在的人口结构和十年前是否一样,血型是否和人的性格有关系,现代社会中受过高等教育、高中毕业、初中毕业、小学毕业和文盲的比例是否为3:6:10:2:1等问题都可以通过卡方检验来实现卡方检验的原理(1)Ø卡方检验的原假设是:H0样本来自的总体的分布与假设的分布(又称期望分布或者理论分布)无显著差异Ø卡方检验的基本思想是,如果从一个随机变量X所在的总体中随机抽取若干个观察样本,这些观察样本落在X的k个互不相交的子集中的观测频数服从一个多项分布,这个多项分布当k趋于无穷时近似服从卡方分布。
卡方检验的原理(2)Ø如果变量X有k个互不相交的子集,在成立的条件下,变量值落在第i个子集的频数设为;设实际观测到的第i个子集的频数为,则有以下Pearson卡方统计量卡方检验的原理(3)Ø卡方统计量服从自由度为k-1的卡方分布如果卡方值较大,则说明期望频数与观测频数分布差距较大,没有证据支持原假设;反之,卡方值较小,说明期望频数与观测频数比较接近,不能拒绝原假设的论断卡方检验例子Ø数据文件dischargedata.sav记录了Winnipeg医院每天的病人流量医院管理者需要了解是否一周中每天的病人流量是相同的 Discharg列为日均病人流量Ø原假设: 星期一到星期六、星期日每天的病人流量是相等的SPSS实现卡方检验Ø选择【分析】->【非参数检验】->【单样本】Ø在设置标签上,选择“比较观察可能性和期望可能性”Ø在字段标签上,选择变量“day”选项设置检验结果分析Ø聚类条形图显示检验字段每个类别的观察频率和假设频率悬停在条形上将在工具提示中显示观察频率和假设频率及其差别(残差)观察和假设条形中的可见区别表明检验字段可能没有假设的分布二项式检验ØSPSS的二项式检验通过样本数据检验样本来自的总体是否服从指定的二项分布。
例如,现代社会男、女的比例是否为1.01:1;工厂的次品率是否为1%等都可以通过二项式检验完成 K-S检验 ØK-S检验是利用样本数据推断样本来自的总体是否与某一理论分布有显著差异,它是拟合优度检验的方法之一ØK-S检验可以检验某个班级的某科的成绩是否与正态分布有显著差异,某地区新生婴儿的体重是否与正态分布有显著差异ØSPSS的K-S检验可以检验四种理论分布:正态分布、均匀分布、泊松分布和指数分布 Ø单样本K-S检验的原假设为:样本来自的总体与指定的理论分布无显著差异Wilcoxon符号秩检验ØWilcoxon符号秩检验用于检验样本所来自的总体的中位数和所给的值是否有显著区别该检验适用于连续型数据(或者尺度数据),它把观测值和原假设的中心位置之差的绝对值的秩分别按照不同的符号相加作为其检验统计量 ØWilcoxon符号秩检验的原假设为:样本所来自的总体的中位数等于给定的数值游程检验 Ø游程检验用于检验某一变量的两个值的出现顺序是否随机,对于连续型变量的随机性检验也可以转化为只有两个取值的分类变量的随机性的检验游程检验通过对样本观测值的分析,用来检验该样本所来自的总体序列是否为随机序列(又称为白噪声序列)。
它也可以用来检验一个样本的观测值之间是否相互独立Ø游程检验的原假设为:总体中变量值的出现是随机的独立样本非参数检验 Ø独立样本非参数检验使用一个或多个非参数检验方法来识别两个或更多个组间的差别对于两个分布未知的总体,或者两个总体的分布不服从正态时,我们无法应用T检验来比较两个总体可以转而应用非参数的方法来比较两个总体的中心位置的差异独立样本是指样本来自的总体相互独立 Ø独立样本包括两个独立样本或者两个以上的独立样本ØSPSS提供的独立样本非参数检验的方法有:Þ两个独立样本分布的比较Mann-Whitney UKolmogorov-SmimovWald-WolfowitzÞK个独立样本分布的比较Kruskal-WallisJonckheere-TerpstraÞ比较全矩Moses extreme reactionÞ比较各组的中位数Median test独立样本检验举例 Ø一个公司把他们的销售代表随机分到三个不同的组中,进行不同的培训两个月后对销售进行考察,我们想通过非参数检验比较不同组别的销售代表考试得分是否有显著性差异这里,不同组别的考试得分是相互独立的,因此为独立样本数据,我们采用独立样本非参数检验。
相关样本非参数检验Ø当比较一个总体的两个不同测量的差别时,如果这两个测量的分布未知,或者它们所来自的总体明显不服从正态分布时,配对的T检验不再适用我们需要应用非参数的方法SPSS相关样本非参数检验使用一个或多个非参数检验识别两个或更多相关字段间的差别 应用范围Ø每个记录对应于有两个或更多相关测量值存储在数据集中单独字段中的给定受试人例如,如果每个受试人的体重以定期间隔测量并存储在如节食前体重、中间体重和节食后体重这样的字段中,则可使用样本相关非参数检验分析节食计划的有效性研究这些字段为“相关”Ø相关样本的非参数检验是配对T检验的推广SPSS中的实现ØSPSS相关样本的非参数检验对话框和单样本的非参数检验一样有三个选项卡u在“目标”选项卡上指定目标u在“字段”选项卡上指定字段分配 u在“设置”选项卡上指定专家设置 相关样本检验举例 Ø数据文件healthplans.sav记录了某公司雇员对四种不同医疗保险计划的评价,每个雇员对每一种医疗保险方案给出从“非常不喜欢”到“非常喜欢”四种不同评价中的一种我们想检验公司雇员对不同医疗保险计划的喜好程度是否有显著差别Ø该数据为同一个雇员的四种不同评价,为相关样本数据,因此采用相关样本非参数检验。
设置字段选择相应检验方法Ø在“设置”选项卡中选择“Friedman按秩二因素ANOVA(K样本)”,并且在多重比较中的下拉框中选择“逐步降低” 结果分析Ø可 直 观 看 出 “PPO计 划 2、 HMO计 划 1、HMO计划2”可划分在同一子集中,同样地“HMO计划1、HMO计划2、PPO计划1”也可划分在同一子集中,同一颜色用来表示同一子集动手练习Ø细菌污水处理厂的微生物生态系统中最重要的组成部分水资源管理工程师认为在某个指定工厂收集的污水样本中活性细菌的百分数的中位数为40如果活性细菌的百分数的中位数大于40,则应该调整污水处理过程数据Water.sav记录了含有10个污水样品的随机样本中活性细菌的百分数在显著性水平为5%的条件下,该样本提供了充分证据表明污水样本中活性细菌的百分数的中位数大于40吗? 谢谢!。
