您所在位置：网站首页 > 高等教育 > 大学课件 > 第七章卡方检验p研究报告

第七章卡方检验p研究报告.ppt

40页

卖家[上传人]：yuzo****123

文档编号：238440297

上传时间：2022-01-11

文档格式：PPT

文档大小：1.37MB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

15金贝

下载

/ 40 举报版权申诉马上下载

文本预览

下载提示

常见问题

第七章卡方(2)检验教学要求了解2检验是质量性状资料的差异显著性检验理解适合性检验、独立性检验的意义与原理，掌握适合性检验、独立性检验的方法重点与难点重点：适合性检验、独立性检验的方法难点： 2分布与分割思考题及作业 1、2检验与t检验、F检验在应用上有什么区别？ 2、什么情况下检验需作矫正？如何矫正？为什么？ 3、为什么要应用分解法来分解总值？ 4、习题作业：标准化综合测试题第七章17题参考书1贵州农学院(主编).2001.生物统计附试验设计教材.中国农业出版社.115137页2扬茂成(主编).1990.兽医统计学中国展望出版社.116134页第一节 2检验的意义与原理1、阐述卡方检验用于遗传学上、医学临床等试验获得次数资料的显著性检验的意义2、重点介绍2分布的特点及显著性检验的步骤质量性状资料属于间断性分布即二项分布或普哇松分布类型，对这种类型的资料必须根据不同的质性范围，点清每一质性范围内所包括的家畜头数（或次数）加以质性分类，来寻找质性资料的变化规律如家畜的性别，遗传学上杂种后代的分离现象如各种毛色，有角无角等；医学临床试验的阳性、阴性；病畜的治疗、好转、无效、死亡等均属此类这类资料也称次数资料。

对这类资料的分析有一部分可通过计算各种相对数（如率、构成比、相对比）来处理，但它的显著性检验绝大部分需用检验一、检验的意义检验是次数资料显著性检验的方法它是通过提出某种假设，用理论次数与观察次数进行比较，从而确定两者的符合程度由于研究目的不同，检验可分为适合性检验与独立检验适合性检验是用来检验某性状观察次数与该性状的理论比率（或理论次数、预期的理论次数）是否符合但它的理论比率是以一定的理论为基础的假设，检验目的是检验实际次数（或比率）与其符合程度如：遗传学上一对性状杂种后代的分离现象是否符合孟德尔遗传定律31的比率；家畜的性别是否符合11的性别比等独立性检验是研究两类试验因子之间是相互独立还是相互影响的，也是次数资料的相关性研究它所用的理论次数是根据两类因子相互独立的假设推演出来的，它没有一个给定的比率如不同配种方法与受猪场共有476头小猪，其中母的248头，公猪228头，按性别11之比则小母猪的理论次数为238头，小公猪亦为238头，计算它们的(OE)2值（见表71）观察次数与实际次数的离差平方和越大，(OE)2也越大；反之越小似乎(OE)2表71 性别值计算表性别观察次数（O）理论次数（E）OE(OE)2(OE)2/E公母22824823823810+101001000.42020.4202总和47647600.8204可以用来度量两者的相差程度，但稍加考虑，即可发现。

单纯用(OE)2还不足以表示相差的程度如：某一资料的一组观察次数与理论次数分别为303、300，(OE)=3；另一组为18和15，(OE)=3，虽然(OE)2均为9，但前者为三百多个次数中仅差3个，后者在十多个次数中就差3个，其所占的比重显然是不同的、为弥补这个缺点，须把(OE)2变为相对值，即把(OE)2的数值与相应的理论次数相比，即(OE)2/E然后把各组的(OE)2/E都相加起来得出一个总值，此值为（卡方）值即；(71) （二）2 分布如果从一个巳知平均数为方差为2的正态总体中，随机抽得随机变量x，其标准离差u=（x）/则必服从平均数为零，方差为1的标准正态分布N（0，1）若在该总体中随机抽得n个相互独立的随机变量，则n个ui的平方和便得出一个新的统计量为每个u可得u2（x）2/2，则变量：（72）其分布服从自由度为n的卡方分布因此，可定义为正态分布独立变量u的平方总和，即卡方分布作为若干个独立变量平方和的概率分布，这些独立变量的每个都有一个标准正态分布其概率密度函数为：通常为未知的，以统计量代替，则变量的分布服从自由度为n1的卡方分布记作可见分布是由标准正态分布而产生的，它是连续性变量的一个分布形式，并具有概率密度函数。

1899年皮尔逊（Kpearson）提出了作为检验观察次数与理论次数符合程度的检验，其定义即为(71)式所示统计学家斯奈迪克(GWSnedecor)曾作了的一个抽样分布，其结果与理论上的分布很近似这个抽样试验是将大小相同，色泽不同的两种豆子（黄色和青色）各1000粒混于小罐中，每次抽取100粒，数清黄、青数各若干粒记录结果把豆子放回混匀再抽第二个样本，共抽了230个样本从理论上说，一个样本如为100粒，则应50粒黄豆，50粒青豆但实际抽样试验中两者完全相等是极少的总存在一定的偏差，每一样本经公式（71）计算便可得一个值如其中的一个样本，包含黄豆47粒，青豆53粒，求得值为：这样230个样本，可得230个值将实际资料列成次数分布表（表72）和图71，便可视为自由度为1（每个样本仅含两组）的分布表72 由230个样本算得230个值次数分布组段次数组段次数0.000.490.500.991.000.491.501.992.002.492.502.993.003.493.503.994.004.494.504.995.005.495.505.991163918221255612006.006.496.506.997.007.497.507.998.008.498.508.999.009.499.509.9910.0010.4910.5010.9911.0011.5001000100101230 图71用矩形图表示230个的抽样分布如果样本数增加到数千个。

则图71的分布接近于图72的自由度等于1的理论分布形式当样本的组数增加到3个df=2时，分布与df=1稍有不同，随着分组数即自由度增大，其分布也逐渐对称图72各个自由度的分布曲线3自由度逐渐增大，曲线趋对称，df=30时分布近于正态分布分布的特点：1由于是由ui平方构成的，所以没有负值，分布在0之间2分布是个偏斜分布，随自由度df的减少而加剧当df=1时，曲线以纵轴为渐近线（三）2的显著性检验在适合性检验中：1建立假设H0：观察次数与理论次数之偏差等于零，或两者是符合的HA：观察次数与理论次数之偏差不等于零，两者是不符合的2由自由度df和显著平准0.05和=0.01，查表得临界值，与实际求得的值比较，作出统计推断：则p0.05差异不显著若则0.01p0.05差异显著则0.01p差异极显著当P0.05接受H0，即差异不显著表明观察次数与理论次数是符合的若0.01P0.05和P0.01，H0被否定，接受HA，表明差异显著和极显著，观察次数和理论次数是不符合的当然，在下结论时也要考虑到两类错误的可能性在独立性检验中：1无效假设H0：两类因子之间是相互独立的HA：两类因子之间是有关联的。

2 的显著性检验当接受H0，即差异不显著时，表明两类因子之间是独立的，两因子的变动无交互作用，或者它们是齐性的若H0被否定而接受了HA，则表明两因子之间并非独立，其中一个因子的变动对另一因子各组观察次数会产生影响；（四）连续性矫正而且影响的结果并非一致的，有的影响大，有的较小，表现出两因子是有关联的74）由分布可见，它的理论分布是连续性的分布类型而实际资料所得的值都是非连续性的分布因此2分析的结果，仅是理论分布的一个近似值，那么所得的结论就不是建立在准确的平准之上的经连续性分布所求得的曲线下面积的概率，与离散性分布所求得的真正概率相比，往往造成偏低的估计尤其在df=1时，更为不适用，因此对于df=1的分析，Yates（1934年）提出了一个矫正公式式中：为矫正后的经矫正后，使其概率接近于真正概率，可免除犯型错误的可能性仅适用于df=1，而不适用于df1当n的数量很大，非连续性作用，即使df1的情况改变值也很小如果df=1，n又很小，不足以计算无偏倚的值，可用直接概率计算法来计算较为精确的值（计算方法详见本章补充内容）df=1的资料，当理论次数很小时，而总的分组格子数中E5的理论次数不能超过15。

若遇到上述情况，将邻近组作合并计算0.5为连续性矫正常数值，第二节适合性检验重点掌握用于遗传学和普哇松分布研究中的适合性检验的方法一、适合性检验的意义适合性检验是检验实际质性分配是否依循着已知质性分配的理论或学说如：一对基因的遗传试验观察白猪和黑猪杂交子二代260头中，白猪181头、黑猪79头，是否符合孟德尔分离定律31；某猪场初生490头仔猪中，公猪260头、母猪230头，是否符合性别11的比例检验时，通过实际观察次数（头数）与按理论比例求得的理论次数进行比较，两者是否符合二、适合性检验方法例1用上述观察白猪和黑猪杂交二代毛色分离现象为例具体步骤：（一）建立假设H0：子二代分离现象18179是符合31的理论比例HA：子二代分离现象不符合31比例二）计算公式适合性检验的自由度df=n1，n为质性分类数本例研究毛色分离这一因子，仅分两类（白色与黑色），df=21=1三）计算理论值根据比率31计算白色理论次数2603/4=195黑色理论次数2601/4=65（四）列表计算，求出值表73 计算表（理论比率3：1）性状观察次数（O）理论次数（E）OE(OE)2/E白色黑色181791956514+140.9352.8041.0053.015总和26026003.7394.020(|OE|0.5)2/E （五）查表作统计推断本例df=1这是根据质性分类来确定的。

也可这样理解，由于在计算各质性分类理论数时，受一个总次数的限制，故df=n1，或者说在两个质性分类中，只要求得一个分类的理论值，另一个通过与总次数相减便可求得还有人认为根据构成变量的独立变量来确定以本例来说，构成变量的二个变量中仅有一个是独立的确定自由度后，可查表（附表6），故p0.05差异不显著，表明本次试验观察次数与理论次数是符合的，即样本毛色白黑18179符合31的理论比率本例如不进行矫正，其结果：求得，故p0.05差异显著，否定H0，可见当df=1时矫正是很有必要的，尤其是所求的值与临界接近时，更有意义例2两对性状杂种后代分离现象的适合性检验杂种后代的4种基因型的观察次数；为15239536，试问是否符合9331的遗传比例三）计算理论次数根据各基因型比率求出理论次数AB：2509/16=140.625Abb：2503/16=46.875aaB：2503/16=46.875aabb：2501/16=15.625（四）列表求值（列表74）具体步骤（一）建立假设H0：两性状的F2是符合9331理论比率HA：不符合9331的理论比率（二）计算公式本例df=n1=41=3表74 计算表（理论比率9331）基因型观察次数（O）理论次数（E）OE(OE)2/EABAbbaaBaabb15239536140.62546.87546.87515.62511.3757.8756.1259.6250.99201.3230.8005.929总和250250.0000=8.972=0.920+1.323+0.800+5.929=8.972 （五）查表当df=3时，故0.01p0.05。

表明本试验两对基因后代的分离现象不符合9331的理论比率进一步分析结论，看其结果不符合的程度是集中在某几个组内，还是都不符合本例4个值（0.920、1.320、0.800、5.929）中，以5.929这个值起作用最大，表明基因型aabb这一类型（OE）的偏差最大，因此可进一步检验（六）检验的再分割法经检验差异显著，只是说明整个资料的结论是不符合理论比率的其不符合程度是所有的比率不符还是只是在某个比率上，总值不能反映出来为确定各比率的符合程度，必需进一步对值再作分割就像经F检验一样，若差异显著，需作多重比较，才能确定差异显著所在组间分割法的具体方法是：一张列联表的总卡方统计量，能分解为数目等于该表总自由度的多个分量。

点击阅读更多内容