电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

列联表卡方检验与对数线性模型课件

43页
  • 卖家[上传人]:我***
  • 文档编号:145338571
  • 上传时间:2020-09-19
  • 文档格式:PPT
  • 文档大小:1.36MB
  • / 43 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、列联表、c2检验和对数线性模型,三维列联表(关于某项政策调查所得结果:table7.sav),列联表,前面就是一个所谓的三维列联表(contingency table). 这些变量中每个都有两个或更多的可能取值。这些取值也称为水平;比如收入有三个水平,观点有两个水平,性别有两个水平等。该表为322列联表 在SPSS数据中,表就不和课本印的一样,收入的“低”、“中”、“高”用代码1、2、3代表;性别的“女”、“男”用代码0、1代表;观点“赞成”和“不赞成”用1、0代表。有些计算机数据对于这些代码的形式不限(可以是数字,也可以是字符串)。,Table7.sav 数据,列联表,列联表的中间各个变量不同水平的交汇处,就是这种水平组合出现的频数或计数(count)。 二维的列联表又称为交叉表(cross table)。 列联表可以有很多维。维数多的叫做高维列联表。 注意前面这个列联表的变量都是定性变量;但列联表也会带有定量变量作为协变量。,二维列联表的检验,研究列联表的一个主要目的是看这些变量是否相关。比如前面例子中的收入和观点是否相关。 这需要形式上的检验,二维列联表的检验,下面表是把该例的三

      2、维表简化成只有收入和观点的二维表(这是SPSS自动转化的:Analyze-Descriptive Statistics-Crosstabs-.).,二维列联表的检验,对于上面那样的二维表。我们检验的零假设和备选假设为 H0:观点和收入这两个变量不相关;H1:这两个变量相关。 这里的检验统计量在零假设下有(大样本时)近似的c2分布。 当该统计量很大时或p-值很小时,就可以拒绝零假设,认为两个变量相关。 实际上有不止一个c2检验统计量。包括Pearson c2统计量和似然比(likelihood ratio)c2统计量;它们都有渐近的c2分布。 根据计算可以得到(对于这两个统计量均有)p-值小于0.001。因此可以说,收入高低的确影响观点。,Pearson c2统计量,似然比c2统计量,Oi代表第i个格子的计数,Ei代表按照零假设(行列无关)对第i格子的计数的期望值,二维列联表的检验,刚才说,这些c2统计量是近似的,那么有没有精确的统计量呢? 当然有。这个检验称为Fisher精确检验;它不是c2分布,而是超几何分布。 对本问题,计算Fisher统计量得到的p-值也小于0.001。 聪明的同

      3、学必然会问,既然有精确检验为什么还要用近似的c2检验呢? 这是因为当数目很大时,超几何分布计算相当缓慢(比近似计算会差很多倍的时间);而且在计算机速度不快时,根本无法计算。因此人们多用大样本近似的c2统计量。而列联表的有关检验也和c2检验联系起来了。,Fisher精确检验,SPSS: Weight-Describ-crosstab-exact,table7.sav 其中有变量性别(sex)、观点(opinion)和收入(income);每一列相应于其代表的变量的水平;每一行为一种水平的组合(共有23212种组合(12行), 而每种组合的数目(也就是列联表中的频数)在number那一列上面,这就是每种组合的权重(weight),需要把这个数目考虑进去,称为加权(weight).如果不加权,最后结果按照所有组合只出现一次来算(也就是说,按照列联表每一格的频数为1).由于在后面的选项中没有加权的机会,因此在一开始就要加权.方法是点击图标中的小天平(“权”就是天平的意思),出现对话框之后点击Weight cases,然后把“number”选入即可。,二维列联表情况 加权之后,按照次序选Anal

      4、yzeDescriptive StatisticsCrosstabs。 在打开的对话框中,把opinion和income分别选入Row(行)和Column(列);至于哪个放入行或哪个放入列是没有关系的。 如果要Fisher精确检验则可以点Exact,另外在Statistics中选择Chi-square,以得到c2检验结果。最后点击OK之后,就得到有关Pearson c2统计量、似然比c2统计量以及Fisher统计量的输出了(这里的Sig就是p-值)。,加权:,下面为SPSS对于table7.savs数据产生的下面二维列联表相关分析的输出,利用crosstabs处理三维列联表问题的SPSS选项,利用crosstabs处理三维列联表问题的输出,利用crosstabs处理三维列联表问题的输出,利用crosstabs处理三维列联表问题的输出,高维列联表和(多项分布)对数线性模型,前面例子原始数据是个三维列联表,对三维列联表的检验也类似。 但高维列联表在计算机软件的选项可有所不同,而且可以构造一个所谓(多项分布)对数线性模型(loglinear model)来进行分析。 利用对数线性模型的好处是

      5、不仅可以直接进行预测,而且可以增加定量变量作为模型的一部分。,对数线性模型,现在简单直观地通过二维表介绍一下对数线性模型,假定不同的行代表第一个变量的不同水平,而不同的列代表第二个变量的不同水平。用mij代表二维列联表第i行,第j列的频数。人们常假定这个频数可以用下面的公式来确定:,这就是所谓的多项分布对数线性模型。这里ai为行变量的第i个水平对ln(mij)的影响,而bj为列变量的第j个水平对ln(mij)的影响,这两个影响称为主效应(main effect)。,(多项分布)对数线性模型,这个模型看上去和回归模型很象,但由于对于分布的假设不同,不能简单地用线性回归的方法来套用(和Logistic回归类似);计算过程也很不一样。当然我们把这个留给计算机去操心了。只要利用数据来拟合这个模型就可以得到对于ai和bj的“估计”。 有了估计的参数,就可以预测出任何i,j水平组合的频数mij了(通过其对数)。 注意,这里的估计之所以打引号是因为一个变量的各个水平的影响是相对的,因此,只有事先固定一个参数值(比如a1=0),或者设定类似于Sai=0这样的约束,才可能估计出各个的值。没有约束,则这些

      6、参数是估计不出来的。,(多项分布)对数线性模型,二维列联表的更完全的对数线性模型为,这里的(ab)ij代表第一个变量的第i个水平和第二个变量的第j个水平对ln(mij)的共同影响(交叉效应)。即当单独作用时,每个变量的一个水平对ln(mij)的影响只有ai(或bj)大,但如果这两个变量一同影响就不仅是ai+bj,而且还多出一项。 这里的交叉项的诸参数的大小也是相对的,也需要约束条件来得到其“估计”;涉及的变量和水平越多,约束也越多。,注意,无论你对模型假定了多少种效应,并不见得都有意义;有些可能是多余的。本来没有交叉影响,但如果写入,也没有关系,在分析过程中一般可以知道哪些影响是显著的,而那些是不显著的。,两种对数线性模型,前面介绍的多项分布对数线性模型假定所有的可能格子里面的频数满足多项分布。 另一类为Poisson对数线性模型.它假定每个格子里面的频数满足一Poisson分布(后面再介绍). 统计软件的选项中有关于分布的选项 高维表的检验统计量和二维表一样也包含了Pearson c2统计量和似然比c2统计量。,用table7.sav数据拟合对数线性模型,假定(多项分布)对数线性模型

      7、为,这里ai为收入(i=1,2,3代表收入的低、中、高三个水平),bj为观点(j=1,2代表不赞成和赞成两个水平),gk为性别(k=1,2代表女性和男性两个水平), mijk代表三维列联表对于三个变量的第ijk水平组合的出现次数。 而从相应的参数估计输出结果,可以得到对ai的三个值的估计为0.5173, 0.2549,0.0000,对bj的两个值的估计为-0.6931,0.0000,对gk的两个值的估计为 0.1139,0.0000。(多项对数线性模型常数无意义,输出的常数项仅仅是数学意义),SPSS输出,就这里的三维列联表问题,如只考虑各个变量单独的影响,而不考虑变量组合的综合影响,其SPSS输出的Pearson c2统计量和似然比c2统计量得到的p-值分别为0.0029和0.0011。,SPSS输出,SPSS的实现,数据table7.sav 假定已经加权 (加权一次并存盘了既可) 这时的选项为AnalyzeLoglinearGeneral, 首先选择格子中频数的分布,这里是多项分布 (其默认值是Poisson对数线性模型). 然后把三个变量(sex,opinion,income)选

      8、入Factors(因子); 再选Model(模型),如果选Saturated(饱和模型),那就是所有交叉效应都要放入模型;但如果不想这样,可以选Custom(自定义),在Building Terms(构造模型的项)选Main effect(主效应),再把三个变量一个一个地选进来(如果两个或三个一同选入,等于选入交叉效应). 如果想要知道模型参数,在Options中选择Estimates。 最后Continue-OK即可得出结果. 在计算机输出的结果中可以找到我们感兴趣的结果。 如果SPSS的Viewer输出不完全,可以选中不完全的输出,利用Edit-Copy Objects来复制到例如记事本那样的文件中,就可以看到完整输出了,Poison对数线性模型,有的时候,类似的高维表并不一定满足多项分布对数线性模型。下面看一个例子。这是关于哮喘病人个数和空气污染程度,年龄和性别的数据(asthma.sav) 后面表格为某地在一段时间记录的60组在不同空气污染状态的不同年龄及不同性别的人的发生哮喘的人数。 其中性别为定性变量S(sex, 1代表女性,2代表男性), 空气污染程度P也是定性变量(po

      9、lut, 1、2、3分别代表轻度、中度和严重污染), 年龄A (age)为定量变量,为那一组人的平均年龄; 还有一列计数C (count)为这一组的哮喘人数。 这个表格和前面的列联表的不同点在于每一格的计数并不简单是前面三个变量的组合的数目(某个年龄段,某种性别及某种污染下的人数),而是代表了某个年龄段,某种性别及某种污染下发生哮喘的人数。,Poisson对数线性模型简介在某些固定的条件下, 人们认为某些事件出现的次数服从Poisson分布, 比如在某一个时间段内某种疾病的发生病数, 显微镜下的微生物数, 血球数, 门诊病人数, 投保数, 商店的顾客数, 公共汽车到达数, 电话接通数等等. 然而, 条件是不断变化的. 因此, 所涉及的Poisson分布的参数也随着变化.,Poisson对数线性模型,假定哮喘发生服从Poisson分布;但是由于条件不同,Poisson分布的参数l也应该随着条件的变化而改变。这里的条件就是给出的性别、空气污染程度与年龄。当然,如何影响以及这些条件影响是否显著则是我们所关心的。这个模型可以写成,这里m为常数项,ai为性别(i=1,2分别代表女性和男性两个水平),bj为空气污染程度(j=1,2,3代表低、中高三个污染水平),x为连续变量年龄,而g为年龄前面的系数,eij为残差项。,Poisson对数线性模型,从对于数据(asthma.sav)的Poisson对数线性模型的相应SPSS输出,可以得到对m的估计为4.9820,对ai的两个值的“估计”为-0.0608、 0.0000,对bj的三个值的“估计”为-0.1484,0.1223、0.0000,对g的估计为 0.0126。 注意,这里的对主效应aI和bj的估计只有相对意义;它们在一个参数为0的约束条件下得到的。 从模型看上去,年龄和性别对哮喘影响都不那么重要。轻度污染显然比中度污染和严重污染哮喘要好。但是似乎严重污染时哮喘稍微比中度污染少些(差别不显著)。 通过更进一步的分析(这里不进行),可以发现,中度和严重空气污染(无论单独还是一起)和轻度空气污染比较都显著增加哮喘人数,而中度及严重污染时的哮喘人数并没有显著区别。,数据(asthma.sav),m=read.table(d:/booktj1/data/asthma.txt) names(m)=c(Sex,Polution,Age,

      《列联表卡方检验与对数线性模型课件》由会员我***分享,可在线阅读,更多相关《列联表卡方检验与对数线性模型课件》请在金锄头文库上搜索。

      点击阅读更多内容
    TA的资源
  • 2020届中考英语备考复习-作文课件

    2020届中考英语备考复习-作文课件

  • 2019年中考英语复习-专题十五-交际运用(试卷部分)课件

    2019年中考英语复习-专题十五-交际运用(试卷部分)课件

  • 2019届二轮复习-高中英语-情态动词和虚拟语气课件

    2019届二轮复习-高中英语-情态动词和虚拟语气课件

  • 2019届一轮复习苏教版物质的跨膜运输课件

    2019届一轮复习苏教版物质的跨膜运输课件

  • 2019年北师大版英语单元复习课件::Unit17Laughter课件北师大版选修6

    2019年北师大版英语单元复习课件::Unit17Laughter课件北师大版选修6

  • 2021届新中考物理冲刺备考复习-力-弹力-重力课件

    2021届新中考物理冲刺备考复习-力-弹力-重力课件

  • 2019届一轮复习人教版种群的特征和数量变化课件

    2019届一轮复习人教版种群的特征和数量变化课件

  • 2020年高考地理一轮复习--等高线地形图-课件

    2020年高考地理一轮复习--等高线地形图-课件

  • 2019版高考英语一轮复习-Unit-1-Living-well课件

    2019版高考英语一轮复习-Unit-1-Living-well课件

  • 2019届一轮复习人教版孟德尔的遗传定律——基因分离定律课件

    2019届一轮复习人教版孟德尔的遗传定律——基因分离定律课件

  • 2019届高三第二轮复习专题二万有引力定律及其应用课件

    2019届高三第二轮复习专题二万有引力定律及其应用课件

  • 2020最新部编版语文五年级上册23-鸟的天堂课件含课后练习

    2020最新部编版语文五年级上册23-鸟的天堂课件含课后练习

  • 2020版高考(浙江)一轮复习:第7讲-细胞呼吸课件

    2020版高考(浙江)一轮复习:第7讲-细胞呼吸课件

  • 2020年新教材高中英语UNIT4HISTORYANDTRADITIONSSectionⅢDiscoveringUsefulStructures课件必修第二册

    2020年新教材高中英语UNIT4HISTORYANDTRADITIONSSectionⅢDiscoveringUsefulStructures课件必修第二册

  • 2019届高考历史二轮复习阶段三专题十三罗斯福新政与当代资本主义的新变化课件2

    2019届高考历史二轮复习阶段三专题十三罗斯福新政与当代资本主义的新变化课件2

  • 2019版高考生物二轮复习-专题三-细胞的生命历程-考点9-细胞分裂过程图像和坐标曲线的识别课件

    2019版高考生物二轮复习-专题三-细胞的生命历程-考点9-细胞分裂过程图像和坐标曲线的识别课件

  • (通史版)2021版高考历史一轮复习第4部分高考讲座(三)2高考非选择题(12分开放探究题)规范答题讲练课件

    (通史版)2021版高考历史一轮复习第4部分高考讲座(三)2高考非选择题(12分开放探究题)规范答题讲练课件

  • 2019届高三地理复习第五讲--《区际联系与区域协调发展》课件

    2019届高三地理复习第五讲--《区际联系与区域协调发展》课件

  • 2021人教部编版历史九年级上册习题课件:第18课美国的独立

    2021人教部编版历史九年级上册习题课件:第18课美国的独立

  • 2020学年新教材高中英语Unit1FoodforthoughtPeriodTwoStartingout课件

    2020学年新教材高中英语Unit1FoodforthoughtPeriodTwoStartingout课件

  • 点击查看更多
    最新标签
    发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结 2022年家长会心得体会集合15篇
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.