
非参数统计.ppt
31页第七章第七章 非参数统计非参数统计 第一节第一节第一节第一节 非参数统计的概念和特点非参数统计的概念和特点非参数统计的概念和特点非参数统计的概念和特点什么是非参数统计什么是非参数统计样样本本总体总体对总体分布的形式未知,或不作任何假定时,依赖样对总体分布的形式未知,或不作任何假定时,依赖样本对总体是否具有某种性质、特征进行推断的统本对总体是否具有某种性质、特征进行推断的统计方法计方法 分布已知分布已知 分布未知分布未知 样样本本??推断推断 检验检验 参数参数方法方法非参数非参数方法方法非参数统计的特点非参数统计的特点不要求对总体分布不要求对总体分布作任何限制性假定作任何限制性假定不以估计总体参数不以估计总体参数为目的为目的可用于定名测定和可用于定名测定和定序测定的变量定序测定的变量方法直观,易于理方法直观,易于理解,运算比较简单;解,运算比较简单;若总体分布能确定时,较参数方法效率差若总体分布能确定时,较参数方法效率差第二节第二节 χ2检验检验一、拟合优度检验一、拟合优度检验利用样本信息对总体是否与某种假设的理论分布符利用样本信息对总体是否与某种假设的理论分布符合的检验。
合的检验假设总体假设总体 X 服从某一分布,服从某一分布,将样本分成将样本分成 K 类(组),观察样本数据在类(组)类(组),观察样本数据在类(组)出现的频数出现的频数 f1,,f2,,…,,fk 在原假设在原假设 H0下,得到下,得到每一类(组)的预期频数:每一类(组)的预期频数: fe1,,fe2,,…,,fek 若H0为真,为真, fi 与与 fei 的差异应该不显著的差异应该不显著检验的基本思想检验的基本思想其中:其中: k—样本分类(组)数样本分类(组)数 检验统计量检验统计量皮尔森拟合优度皮尔森拟合优度χ2 统计量:量:皮尔森定理皮尔森定理:如果原假:如果原假设H0成立,成立,则在在样本容量本容量n→∞时,时,χ2 的分布的分布趋向于向于k-1的卡方分布的卡方分布H0 总体为完全给定的概率分布形式时,总体为完全给定的概率分布形式时, χχ2 2 统计统计量的自由度为量的自由度为k-1k-1H0 总体服从某种形式的概率分布时,总体服从某种形式的概率分布时,χ2 χ2 统计统计量的自由度为量的自由度为k-k-r-1 1 ,, r等于需要估计的参数的个数等于需要估计的参数的个数。
检验步骤检验步骤((1)对总体分布建立假设)对总体分布建立假设 H0:总体服从某种理论分布:总体服从某种理论分布 H1:总体不服从该理论分布:总体不服从该理论分布注意注意((2)抽样并对样本资料编成频数分布()抽样并对样本资料编成频数分布(fi))((3)以)以“原假设原假设H0为真为真”导出一组期望频数(导出一组期望频数(fei))((4)计算检验统计量)计算检验统计量χ2=∑(fi-fei)2/fei((5)给定的)给定的α查查χ2表,比较表,比较χ2值与值与χ2临界值临界值((6)作出检验判断)作出检验判断拟合优度检验需要注意拟合优度检验需要注意((1)各组理论频数)各组理论频数fei不得小于不得小于5;;((2)样本单位数)样本单位数 n >>50;;((4)注意)注意 r 的取值的取值((3)若某一类(组)理论频数)若某一类(组)理论频数 < 5,应与邻类,应与邻类(组)合并,且(组)合并,且k应为实际类(组)数应为实际类(组)数三、独立性检验三、独立性检验 利用样本信息对两组数据是否彼此关联的检验利用样本信息对两组数据是否彼此关联的检验。
特点特点特点特点在于其理论频数由样本实际频数计算得出在于其理论频数由样本实际频数计算得出 设有一组观察值(设有一组观察值(X1,Y1)、()、(X2、、Y2))…((Xn、、Yn)) X有有1,,2…r种状态,种状态, Y有有1,,2…c种状态,种状态,将其编成将其编成r×c列联表(联合频数分布表),列联表(联合频数分布表),用用Oij表示表示X、、Y同时发生的频数:同时发生的频数:列联表形式(列联表形式(r×c))O11O21O31...Or1O12O22O32...Or2O13O23O33...Or3………...…O1cO2cO3c...OrcO1·O2 ·O3 ·...Or · 123...rXY123…cxy合计合计O i· O.1 O.2O.3…O.cn合计合计O ·j记:记:若若若若X X、、、、Y Y相互独立,应有相互独立,应有相互独立,应有相互独立,应有::检验检验X和和Y的独立性,等于检验:的独立性,等于检验:显然显然检验步骤检验步骤((1)建立假设)建立假设H0:两组变量独立:两组变量独立H1:两组变量不独立:两组变量不独立((2)将样本资料编成)将样本资料编成r×c列联表,并列出实列联表,并列出实际频数际频数Oij((3)计算理论频数)计算理论频数((4 4)计算检验统计量)计算检验统计量((5)给定的)给定的α,若,若χ2> χα2,拒绝原假设,拒绝原假设2×2的列联表资料,的列联表资料,χ2值简算公式值简算公式xy1212abcda+cb+da+bc+d合计合计合计合计n第三节第三节 成对比较检验成对比较检验一、符号检验一、符号检验 用两组样本数据之差的正、负符号判断两个总用两组样本数据之差的正、负符号判断两个总体特征是否存在差异的检验方法,亦称正负号检验。
体特征是否存在差异的检验方法,亦称正负号检验特点:特点:来自两个总体的两个样本来自两个总体的两个样本可以相关,也可以独立可以相关,也可以独立对分布、方差均不对分布、方差均不作任何假定作任何假定不计具体数值,只考虑不计具体数值,只考虑差数的正负方向差数的正负方向损失了具体数值差损失了具体数值差别的信息别的信息检验步骤检验步骤((1)确定配对样本,识别差)确定配对样本,识别差异,统计正负差异个数异,统计正负差异个数((2)建立假设:)建立假设:H0:两组数据无差异:两组数据无差异 等价于等价于 H0:: P (+) =0.5 H1: P (+) ≠0. 5 ((3)计算检验统计量)计算检验统计量大样本时大样本时::((4)确定拒绝域,)确定拒绝域,比较并作出判断比较并作出判断二、威尔科克森带符号的等级检验二、威尔科克森带符号的等级检验 运用两组数据差异的正、负号,并结合考虑差异运用两组数据差异的正、负号,并结合考虑差异大小判断两总体是否存在差异的检验方法大小判断两总体是否存在差异的检验方法。
检验步骤检验步骤((1)确定配对样本数据并)确定配对样本数据并计算带正负号的差异数值计算带正负号的差异数值((2)将差值取绝对数后排序并赋顺序)将差值取绝对数后排序并赋顺序等级相邻等值取位序平均数为等级等级相邻等值取位序平均数为等级((3)根据原正负号赋予各等级正负号,并计)根据原正负号赋予各等级正负号,并计算正负等级和算正负等级和T+和和T- ((6)确定检验统计量)确定检验统计量T::T= min ( T+,T-) ((4)确定带正负号的差值的个数为样本)确定带正负号的差值的个数为样本容量容量n ((5)建立假设:)建立假设: H0::T+=T- H1:: T+≠T-((5)设定)设定α,当,当T 亦称连贯检验判断的检验方法亦称连贯检验游程游程每个连续出现某一类每个连续出现某一类样本观察值的区段样本观察值的区段游程游程长度长度每个区段包含的相同每个区段包含的相同样本观察值的个数样本观察值的个数游程的个数游程的个数 r可用来检验样本的随机性可用来检验样本的随机性游程检验方法步骤游程检验方法步骤 将样本观察值顺序排列,找出中位数或平均数将样本观察值顺序排列,找出中位数或平均数以两部分交错形成的游程个数为检验的统计量以两部分交错形成的游程个数为检验的统计量以中位数或平均数为界分样本观察值为两个部分以中位数或平均数为界分样本观察值为两个部分检验的假设检验的假设:Ho:样本具有随机性:样本具有随机性 H1:样本不具有随机性:样本不具有随机性 r(La)<<ro<<r(Lb) 接受接受Ho小样本时,(小样本时,(n<<20))检验规则检验规则大样本时(大样本时(n1或或n2大于大于20),游程个数),游程个数r近似正态分布近似正态分布检验统计量检验统计量其中:其中:第六节第六节 等级相关检验等级相关检验 难以用数字计量难以用数字计量 的现象,要说明现象间的相关的现象,要说明现象间的相关关系,用等级相关的非参数方法。 关系,用等级相关的非参数方法Spearman 等级相关系数:等级相关系数:一、等级相关检验的基本原理一、等级相关检验的基本原理Xi、、Yi 分别为现象分别为现象X、、Y的等级,的等级,i=1,,2,,…n其中:其中: di=Xi-Yi为等级差值为等级差值rs取值范围取值范围 -1
