统计 研究生ppt课件8双变量关联性分析.ppt
28页流行病与卫生统计学系胡利人统计图表1关联分析2【案例12-1】 某医科大学一年级16名男生身高与前臂长资料,见表12-1 表12-1 某医科大学一年级16名男生身高与前臂长资料 直线相关 编 号12345678910111213141516身高(cm)170173160158173186178183180165166174168163177170前臂长(cm)43464241474945484743434644424543关联分析3【问题12-1】 该资料属于哪种类型?有何特点? 利用资料分析两变量的关联性时,应采用何种统计方法? 【分析】 两变量均属于定量资料 可以探讨它们之间的相关关系,根据数据特征采用直线相关分析或等级相关分析直线相关 关联分析4 相关分析的概念 直线相关(1inear correlation),又称简单相关(simple correlation),是用来描述具有直线关系的两变量x、y的相互关系的统计方法要求两变量均来自于双变量正态总体的随机变量 直线相关 关联分析5 相关系数的意义及计算 直线相关系数(linear correlation coefficient)亦称Pearson积矩相关系数,是定量描述两个变量间直线关系的方向和密切程度的指标总体相关系数用 表示,样本相关系数用r表示 直线相关 关联分析6直线相关 进行相关分析时,首先绘制散点图(scatter plot),初步判断两变量间的关系。
(a) 0 r 1 (b) -1 r 0 (c) r =1 (d) r =-1关联分析7直线相关 (e) r =0 (f) r =0 (g) r =0 (h) r =0关联分析8直线相关 图12-2 16名大学一年级男生身高和前臂长散点图 关联分析9直线相关 没有单位,取值介于-1与1之间相关方向用正负号表示相关的密切程度用绝对值表示关联分析10直线相关 计算例12-1中身高与前臂长间相关系数 计算基础数据,并列成相关系数计算表 求出 、 、 、 、 (见表12-2) 代入公式,求出相关系数 值关联分析11表12-2某医科大学一年级16名男生身高与前臂长相关系数计算表编号(1)身高cm(2)前臂长cm(3)(4)(2)2(5)=(3)2(6)=(2)(3)117043289001849731021734629929211679583160422560017646720415841249641681647851734729929220981311517745313292025796516170432890018497310合计274471447157031946122715直线相关 关联分析12直线相关 关联分析13 相关系数的假设检验 查表法 根据自由度 ,查附表14,将所得 值与某概率水平(如0.05)对应的 界值相比较,若 值小于 界值,则P大于相应的概率水平,反之,P小于相应的概率水平,然后作出推断。
直线相关 关联分析14 相关系数的假设检验 t检验方法 直线相关 关联分析15下面对例12-1所得相关系数进行假设检验【检验步骤】1. 建立检验假设,确定检验水准直线相关 关联分析16【检验步骤】2.计算检验统计量 值 直线相关 关联分析17【检验步骤】 3.确定P值,做出统计推断 按自由度 ,查附表4, 按水准,拒绝H0,接受H1,可认为该医科大学一年级男生身高与前臂长呈线性相关关系 直线相关 关联分析18等级相关应用范围:(1)不服从双变量正态分布的资料(2)总体分布类型未知的资料(3)等级资料 Spearman等级相关系数的取值和意义与Pearson直线相关系数相同计算得到的等级相关系数,需对其进行假设检验等级相关关联分析1922列联表的关联性分析 【案例12-8】 欲研究吸烟与慢性支气管炎的关系,随机调查了360名45岁以上人的吸烟习惯和慢性支气管炎情况见表12-4列联表的关联性分析 吸烟习惯患病未患病合计吸烟51116167不吸烟 28 165193合计79281360表12-4 吸烟习惯和慢性支气管炎情况关联分析2022列联表的关联性分析 该研究者采用 检验进行假设检验,结果 ,P0.01,按水准,拒绝H0,接受H1,可认为慢性支气管炎有无与吸烟习惯之间有关联。
列联表的关联性分析 【问题12-8】(1)该资料属于哪种类型?(2)该资料设计及目的与完全随机设计有无区别?(3)分析两个分类变量的关联性应该采用什么方法?关联分析21 【分析】(1)该资料是计数资料,是两个定性变量交叉分类的列联表资料2)完全随机设计中两个样本是独立的3)两个分类变量的关联性分析,先进行 检验,然后计算关联系数,分析两分类变量关联的程度 列联表的关联性分析 关联分析22列联表的关联性分析 吸烟习惯患病未患病合计吸烟51116167不吸烟 28 165193合计79281360表12-4 吸烟习惯和慢性支气管炎情况关联分析23【检验步骤】1. 建立检验假设,确定检验水准H0:吸烟习惯与慢性支气管炎相互独立H1:吸烟习惯与慢性支气管炎之间有关联列联表的关联性分析 关联分析24【检验步骤】2.计算检验统计量 值 列联表的关联性分析 关联分析25【检验步骤】 3.确定P值,做出统计推断 查附表9, ,P0.01,按水准,拒绝H0,接受H1,可认为慢性支气管炎有无与吸烟习惯之间有关联列联表的关联性分析 关联分析264.计算关联系数可计算Pearson列联系数(contingency coefficient) 列联表的关联性分析 关联分析27配对设计22表的关联性分析 RC列联表的关联性分析 列联表的关联性分析 其他类型资料的关联性分析关联分析28。





