好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

基础医学医学统计学课件.ppt

100页
  • 卖家[上传人]:新**
  • 文档编号:584140453
  • 上传时间:2024-08-30
  • 文档格式:PPT
  • 文档大小:372.50KB
  • / 100 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 医学统计学姜长青姜长青首都医科大学附属北京安定医院首都医科大学附属北京安定医院8/30/20241基础医学]医学统计学 医学统计学医学统计学•第一章第一章 概论概论•第二章第二章 集中趋势与离散趋势的统计描述集中趋势与离散趋势的统计描述•第三章第三章 t t检验检验•第四章第四章 方差分析方差分析•第五章第五章 卡方检验卡方检验•第六章第六章 非参数检验非参数检验•第七章第七章 相关与回归相关与回归8/30/20242基础医学]医学统计学 第一章第一章 概论概论•第一节第一节 医学统计学的意义医学统计学的意义•第二节第二节 医学统计工作中的内容和资料类型医学统计工作中的内容和资料类型•第三节第三节 医学统计中的基本概念医学统计中的基本概念8/30/20243基础医学]医学统计学 第一节第一节 医学统计学的意义医学统计学的意义•统计分析是科研工作中的一种有力工具它同统计分析是科研工作中的一种有力工具它同科研的总体设计、资料采集、资料整理、资料科研的总体设计、资料采集、资料整理、资料分析直到最后作出结论都有密切关系掌握了分析直到最后作出结论都有密切关系。

      掌握了这个工具可以使用较少的人力、物力和时间获这个工具可以使用较少的人力、物力和时间获得比较可靠的结果得比较可靠的结果•只有正确运用统计分析方法,才不致于造成不只有正确运用统计分析方法,才不致于造成不应有的缺陷或得出错误的结论应有的缺陷或得出错误的结论8/30/20244基础医学]医学统计学 第二节第二节 医学统计工作中的内容和资料类型医学统计工作中的内容和资料类型•医学统计工作的内容医学统计工作的内容•资料的类型资料的类型8/30/20245基础医学]医学统计学 医学统计工作中的内容医学统计工作中的内容•收集资料收集资料–收集资料就是根据研究的目的,实验设计的要求,收集资料就是根据研究的目的,实验设计的要求,收集准确的、完整的、充满信息的原始资料收集准确的、完整的、充满信息的原始资料•整理资料整理资料–整理资料就是把收集到的原始资料,有目的地进行整理资料就是把收集到的原始资料,有目的地进行科学加工,使资料系统化、条理化,以便进行统计科学加工,使资料系统化、条理化,以便进行统计分析•分析资料分析资料–分析资料就是把经过统计整理的资料,作一系列统分析资料就是把经过统计整理的资料,作一系列统计描述和统计推断,阐明事物的规律性。

      计描述和统计推断,阐明事物的规律性8/30/20246基础医学]医学统计学 资料的类型资料的类型 •计量资料计量资料–是对每个观察对象的观察指标用定量方法测定该项指标是对每个观察对象的观察指标用定量方法测定该项指标的数值大小所得的资料,一般用度量衡单位表示的数值大小所得的资料,一般用度量衡单位表示•计数资料计数资料–是先将观察对象的观察指标按性质或类别进行分组,然是先将观察对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料后计数各组该观察指标的数目所得的资料•等级分组资料等级分组资料–在医学实践中,有些资料具有计数资料的特性,同时又在医学实践中,有些资料具有计数资料的特性,同时又兼有半定量的性质,被称为按等级分组资料兼有半定量的性质,被称为按等级分组资料8/30/20247基础医学]医学统计学 第三节第三节 医学统计中的基本概念医学统计中的基本概念•变异变异•总体和样本总体和样本•抽样抽样•配对设计与随机区组设计配对设计与随机区组设计•误差误差•概率概率8/30/20248基础医学]医学统计学 变变 异异•医学研究的对象是有机的生命体,其机能是十医学研究的对象是有机的生命体,其机能是十分复杂的。

      不同的个体在相同的条件下,对外分复杂的不同的个体在相同的条件下,对外界环境因素可以发生不同的反应这种现象称界环境因素可以发生不同的反应这种现象称只为个体差异或称为变异只为个体差异或称为变异•由于医学统计研究的对象是有变异的事物,因由于医学统计研究的对象是有变异的事物,因此,用观察此,用观察1~2例的结果来推论出一般规律是例的结果来推论出一般规律是不恰当的科学研究工作的主要任务就是要从不恰当的科学研究工作的主要任务就是要从表现为偶然的大量数据中,分析出其中必然性表现为偶然的大量数据中,分析出其中必然性的规律8/30/20249基础医学]医学统计学 抽抽 样样•代表性代表性–就是要求样本中的每一个个体必须符合总体的规定就是要求样本中的每一个个体必须符合总体的规定•随机性随机性–抽签法抽签法–机械抽样法机械抽样法–分层抽样分层抽样–随机数字表随机数字表•可靠性可靠性–指对实验的结果要有可重复性,即由科研课题的样本的结果指对实验的结果要有可重复性,即由科研课题的样本的结果推论总体的结论有较大的可靠性推论总体的结论有较大的可靠性•可比性可比性–如果进行两个或多个样本之间的比较,那么要求每两个样本如果进行两个或多个样本之间的比较,那么要求每两个样本之间应具有可比性,也称为齐性对比原则。

      之间应具有可比性,也称为齐性对比原则8/30/202410基础医学]医学统计学 配对设计与随机区组设计配对设计与随机区组设计•完全随机设计完全随机设计–是将受试对象随机分配到各个处理组或对照组,或是将受试对象随机分配到各个处理组或对照组,或分别从不同总体中随机抽样进行研究分别从不同总体中随机抽样进行研究•配对设计配对设计–它是将受试对象按一定条件配成对子,称为配对样它是将受试对象按一定条件配成对子,称为配对样本,将它们随机分到两个组中,分别给以不同处理本,将它们随机分到两个组中,分别给以不同处理•随机区组设计随机区组设计–它也称为配伍组设计,是配对设计的扩展配对设它也称为配伍组设计,是配对设计的扩展配对设计的每一计的每一“对子对子”分别随机分到两个处理中,而配分别随机分到两个处理中,而配伍设计中的每个伍设计中的每个“配伍组配伍组”,包含有多个受试对象,,包含有多个受试对象,要将它们分别随机分到各处理组要将它们分别随机分到各处理组8/30/202411基础医学]医学统计学 误误 差差•系统误差系统误差–在收集资料过程中,由于仪器初始状态未调到零、标准试剂在收集资料过程中,由于仪器初始状态未调到零、标准试剂未经效正、医生掌握疗效标准偏高或偏低等原因,可使观察未经效正、医生掌握疗效标准偏高或偏低等原因,可使观察结果造成倾向性的偏大或偏小,叫做系统误差。

      结果造成倾向性的偏大或偏小,叫做系统误差•随机测量误差随机测量误差–在收集资料过程中,由于各种偶然因素的影响而造成同一对在收集资料过程中,由于各种偶然因素的影响而造成同一对象多次测定结果的不完全一致这种误差往往没有固定的倾象多次测定结果的不完全一致这种误差往往没有固定的倾向,有时高有时低,被称为随机测量误差向,有时高有时低,被称为随机测量误差•抽样误差抽样误差–个体之间存在变异,而抽样有时只能抽去总体中的一小部分个体之间存在变异,而抽样有时只能抽去总体中的一小部分作为样本作为样本8/30/202412基础医学]医学统计学 概概 率率•概率是描述某一事件发生的可能性大小的一个量度概率是描述某一事件发生的可能性大小的一个量度用用A表示某一事件,表示某一事件,P表示该事件可能发生的概率表示该事件可能发生的概率•在一定条件下,肯定发生的事件称为必然事件,概率在一定条件下,肯定发生的事件称为必然事件,概率为为1;肯定不发生的事件称为不可能事件,概率为;肯定不发生的事件称为不可能事件,概率为0;;可能发生也可能不发生的事件称为随机事件或偶然事可能发生也可能不发生的事件称为随机事件或偶然事件,其概率介于件,其概率介于0与与1之间。

      之间•在统计学上,习惯将在统计学上,习惯将P≤0.05或或P ≤ 0.01称为小概率事件,称为小概率事件,表示该事件发生的可能性很小表示该事件发生的可能性很小•在医学研究中,常把在医学研究中,常把P ≤ 0.05作为事物差别有统计学意作为事物差别有统计学意义义, P ≤ 0.01作为事物差别有高度统计学意义的界限作为事物差别有高度统计学意义的界限.8/30/202413基础医学]医学统计学 第二章第二章 集中趋势与离散趋势的统计描述集中趋势与离散趋势的统计描述•第一节第一节 集中趋势的描述统计集中趋势的描述统计–这一部分的主要内容涉及统计图表和描述平均水平这一部分的主要内容涉及统计图表和描述平均水平和集中趋势的统计量,目的在于有效地组织、整理和集中趋势的统计量,目的在于有效地组织、整理和表现统计资料的信息和表现统计资料的信息•第二节第二节 离散趋势的描述统计离散趋势的描述统计–衡量变异程度大小的指标有多种,但大体可以分为衡量变异程度大小的指标有多种,但大体可以分为两类:一类是按间距计算,有极差和四分位数间距;两类:一类是按间距计算,有极差和四分位数间距;另一类则按平均差距计算,有离均差平方和、均方另一类则按平均差距计算,有离均差平方和、均方差、标准差和变异系数等。

      差、标准差和变异系数等8/30/202414基础医学]医学统计学 第一节第一节 集中趋势的描述统计集中趋势的描述统计•频率分布频率分布•平均数平均数–算术均数算术均数–几何均数几何均数–中位数中位数–百分位数百分位数8/30/202415基础医学]医学统计学 频率分布频率分布•类型类型–频率表频率表–直方图直方图•用途用途–作为陈述资料的形式,可以代替繁复的原始资料,作为陈述资料的形式,可以代替繁复的原始资料,便于进一步分析便于进一步分析–便于观察数据的分布类型便于观察数据的分布类型–便于发现资料中某些远离群体的特大或特小的可疑便于发现资料中某些远离群体的特大或特小的可疑值–当样本含量比较大时,可用各组段的频率作为概率当样本含量比较大时,可用各组段的频率作为概率的估计值的估计值8/30/202416基础医学]医学统计学 算术均数算术均数 •直接法直接法•加权法加权法8/30/202417基础医学]医学统计学 几何均数几何均数•通用式:通用式:•直接法:直接法:•分组法:分组法:8/30/202418基础医学]医学统计学 中位数中位数•直接法直接法•当观察例数为奇数时:当观察例数为奇数时:•M = XM = X((n+1n+1))/2/2•当观察例数为偶数时:当观察例数为偶数时:•M = ½M = ½((X Xn/2n/2+X+Xn/2+1n/2+1))•分组法分组法•其中其中L L、、i iM M、、f fM M、分别为所在组段的下限、组距和频数,、分别为所在组段的下限、组距和频数,f fL L为为M M所在组之前各组段的累积频数。

      所在组之前各组段的累积频数8/30/202419基础医学]医学统计学 百分位数百分位数•百分位数用符号百分位数用符号Px表示,表示,x即百分位,所谓百分位数即百分位,所谓百分位数Px是指在一组数据中找到这样一个值,全部观察值的是指在一组数据中找到这样一个值,全部观察值的x%小于小于Px,而其余(,而其余(100-x))%大于大于Px•其中其中L L、、ixix、、fxfx、分别为、分别为PxPx所在组段的下限、组距和频所在组段的下限、组距和频数,数,f fL L为为PxPx所在组之前各组段的累积频数所在组之前各组段的累积频数8/30/202420基础医学]医学统计学 第二节第二节 离散趋势的统计描述离散趋势的统计描述•极差和四分位数间距极差和四分位数间距•平均偏差平均偏差•离均差平方离均差平方•方差方差•标准差标准差•变异系数变异系数8/30/202421基础医学]医学统计学 积差和四分位数间距积差和四分位数间距•积差积差–也称全距,即一组观察值中最大值和最小值之差,也称全距,即一组观察值中最大值和最小值之差,符号为符号为R R,是变异指标中最简单的一种是变异指标中最简单的一种•四分位数间距四分位数间距–将所有的观察值排序后,分成四个数目相等的段落,将所有的观察值排序后,分成四个数目相等的段落,每个段落的观察值数目各占总例数的每个段落的观察值数目各占总例数的25%25%,去掉两,去掉两端的端的25%25%,取中间,取中间50%50%观察值的数值范围即为四分位观察值的数值范围即为四分位数间距。

      数间距–四分位数间距用符号四分位数间距用符号Q Q表示,它可以通过计算百分表示,它可以通过计算百分位数位数P P7575和和P P2525之差得到,即之差得到,即Q=PQ=P7575-P-P25258/30/202422基础医学]医学统计学 平均偏差平均偏差•计算各观察值偏离平均数的平均差距,为了避免正负抵消,将每个观察值与均数之差的绝对值相加,然后取平均,称作平均偏差,它可以表示为:•平均偏差是一个很直观的变异量度,但由于用了绝对值,在数学上不便于继续处理,使它在应用上受到很大限制,实际中很少使用8/30/202423基础医学]医学统计学 离均差平方和离均差平方和•为了克服平均偏差使用绝对值不便进一步运算的缺点,可以不通过取绝对值,而是通过取平方来避免正负抵消,即使用离均差平方和,其公式为:•它描述了每个观察值相对于集中位置“均数”的分散程度通过计算可化为下式:8/30/202424基础医学]医学统计学 方方 差差•将离均差平方和再取平均,其结果称作均方差,将离均差平方和再取平均,其结果称作均方差,简称方差简称方差•需要注意的是,对于样本资料,在对离均差平需要注意的是,对于样本资料,在对离均差平方和取平均时分母用方和取平均时分母用n-1代替代替n,于是有:,于是有:•式中式中s2为样本方差,分母为样本方差,分母n-1称为自由度。

      称为自由度8/30/202425基础医学]医学统计学 标准差标准差•在统计分析中为了方便,通常将方差取平方根,在统计分析中为了方便,通常将方差取平方根,还原成与原始观察值单位相同的变异量度,即还原成与原始观察值单位相同的变异量度,即标准差,计算公式如下:标准差,计算公式如下:•也可写为:也可写为:8/30/202426基础医学]医学统计学 变异系数变异系数•在两组数据的均数相差不大,单位也相同时,从标准差的大小就可以直接比较两个样本的变异程度•当均数相差较大或单位不同的几组观察值的变异程度进行比较时,标准差就不适宜了,在这种情况下可以使用变异系数,其计算公式为:8/30/202427基础医学]医学统计学 第三章第三章 t 检验检验•第一节第一节 假设检验的意义和步骤假设检验的意义和步骤•第二节第二节 单个样本单个样本 t 检验检验•第三节第三节 配对样本配对样本 t 检验检验•第四节第四节 两独立样本两独立样本 t 检验检验8/30/202428基础医学]医学统计学 第一节第一节 检验假设的意义和步骤检验假设的意义和步骤•检验假设的基本概念检验假设的基本概念–检验假设是对估计的总体首先提出一个假设,然后通过样本检验假设是对估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设。

      如果拒绝,认为该样本很可数据去推断是否拒绝这一假设如果拒绝,认为该样本很可能不是来自这个总体;否则,很可能来自这个总体能不是来自这个总体;否则,很可能来自这个总体•建立检验假设和确定检验水平建立检验假设和确定检验水平–假设:无效假设(假设:无效假设(H0)) / 被择假设(被择假设(H1)) –检验水平:检验水平:•选择检验方法和统计推断分析选择检验方法和统计推断分析–选择检验方法和计算检验统计量选择检验方法和计算检验统计量–确定确定P值和作出统计推断结论值和作出统计推断结论8/30/202429基础医学]医学统计学 第二节第二节 单个样本单个样本 t 检验(检验(1))•例:根据大量调查,已知健康成年男子例:根据大量调查,已知健康成年男子的脉搏均数为的脉搏均数为72次次/分,某医生在某山区分,某医生在某山区随机调查随机调查30名健康男子,求得脉搏均数名健康男子,求得脉搏均数为为74.2次次/分,标准差为分,标准差为6.5次次/分能否认为该山区的成年男子的脉搏均数高于认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?一般成年男子的脉搏均数?8/30/202430基础医学]医学统计学 第二节第二节 单个样本单个样本 t 检验(检验(2))•建立检验假设,确定检验水平建立检验假设,确定检验水平–H0::µ=µ0–H1;;µ µ0–∝∝=0.05•计算检验统计量计算检验统计量•确定确定P值,做出推断结论值,做出推断结论–本例自由度本例自由度v=n-1==n-1=30-1=29–查附表得查附表得t0.05((29))=2.045–今今t0.05, 无统计学意义无统计学意义8/30/202431基础医学]医学统计学 第三节第三节 配对样本配对样本 t 检验(检验(1))•将受试对象按某些重要特征相近的原则配成对子,每对中的两个将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理,称为随机配对设计。

      个体随机地给予两种处理,称为随机配对设计•配对设计资料主要有三种情况:配对设计资料主要有三种情况:–两种同质受试对象分别接受两种处理;两种同质受试对象分别接受两种处理;–同一受试或同一样本的两个部分,分别接受两种不同处理;同一受试或同一样本的两个部分,分别接受两种不同处理;–同一受试对象处理(实验或治疗)前后的结果比较同一受试对象处理(实验或治疗)前后的结果比较•配对设计的检验统计量为:配对设计的检验统计量为:8/30/202432基础医学]医学统计学 第三节第三节 配对样本配对样本 t 检验(检验(2))•例:有例:有12名接种卡介苗的儿童,八周后用两批不同的结核菌素,名接种卡介苗的儿童,八周后用两批不同的结核菌素,一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的前臂,问两种结核菌素的皮肤浸润反应性有无差别?前臂,问两种结核菌素的皮肤浸润反应性有无差别?• 编号编号 标准品标准品 新制品新制品 差值差值d d2• 1 12.0 10.0 2.0 4.00• 2 14.5 10.0 4.5 20.25• 3 15.5 12.5 3.0 9.00• . . . . .• 12 10.5 9.5 1.0 1.00• 合合 计计 39 1958/30/202433基础医学]医学统计学 第三节第三节 配对样本配对样本 t 检验(检验(3))•建立检验假设,确定检验水平建立检验假设,确定检验水平–H0::µd=0–H1;;µd 0–∝∝=0.05•计算检验统计量计算检验统计量•确定确定P值,做出推断结论值,做出推断结论–自由度自由度v=n=n-1=1=12-1=11,, t0.05((11))=2.201 t0.01((11))=3.106–本例本例 t >t0.01((11),),P<0.01, 差别有统计学意义差别有统计学意义8/30/202434基础医学]医学统计学 第四节第四节 两独立样本两独立样本 t 检验检验感•总体方差相等时的两独立样本总体方差相等时的两独立样本 t 检验检验•总体方差不等时的两样本总体方差不等时的两样本 t’ 检验检验8/30/202435基础医学]医学统计学 总体方差相等时的两独立样本总体方差相等时的两独立样本 t 检验检验(1)•两总体方差相等(两总体方差相等(σ12=σ22)时,可将两方差合并,估计出两者的)时,可将两方差合并,估计出两者的共同方差共同方差—合并方差合并方差Sc2。

      •两样本两样本 t 检验的检验统计量为:检验的检验统计量为:•其中,公式其中,公式2为两样本均数之差的联合标准误,公式为两样本均数之差的联合标准误,公式3为联合方差为联合方差8/30/202436基础医学]医学统计学 总体方差相等时的两独立样本总体方差相等时的两独立样本 t 检验(检验(2))•例:例:25例糖尿病患者随机分成两组,甲组单纯用药物治疗,例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,二个月后再次测空腹血乙组采用药物治疗合并饮食疗法,二个月后再次测空腹血糖,问两组患者血糖值是否相同?糖,问两组患者血糖值是否相同?编号编号 1 2 3 4 5 6 7 8 9 10 11 12 13甲组甲组 8.4 10.5 12.0 12.0 13.9 15.3 16.7 18.0 18.7 20.7 21.1 15.2 乙组乙组 5.4 6.4 6.4 7.5 7.6 8.1 11.6 12.0 13.4 13.5 14.8 15.6 18.78/30/202437基础医学]医学统计学 总体方差相等时的两独立样本总体方差相等时的两独立样本 t 检验检验((3))•建立检验假设,确定检验水平建立检验假设,确定检验水平–H0::µ1=µ2–H1;;µ2 µ2–∝∝=0.05•计算检验统计量计算检验统计量•确定确定P值,作出推断结论值,作出推断结论 t >t0.05((23))=2.069,,P<0.05, 差异有统差异有统计学意义。

      计学意义8/30/202438基础医学]医学统计学 总体方差相等时的两独立样本总体方差相等时的两独立样本 t 检验检验(4)•若已知若已知S1、、S2,也可用如下公式计算,也可用如下公式计算SC28/30/202439基础医学]医学统计学 总体方差不等时的两样本总体方差不等时的两样本 t’检验(检验(1))•方差齐性检验方差齐性检验•检验统计量检验统计量F值为两个样本方差之比,若仅为抽样误差的影响,值为两个样本方差之比,若仅为抽样误差的影响,它一般不会偏离它一般不会偏离1太远求得太远求得F值后,查附表得值后,查附表得P值,按所取的值,按所取的α水水准做出判断结论准做出判断结论•统计学对两样本均数比较时,是否需要进行方差齐性检验有不同统计学对两样本均数比较时,是否需要进行方差齐性检验有不同的看法有人提出当一个样本的方差是另一个样本方差的看法有人提出当一个样本的方差是另一个样本方差3倍以上,倍以上,可认为两总体方差不齐有的认为若样本含量较大时(如可认为两总体方差不齐有的认为若样本含量较大时(如n1和和n2均大于均大于50),可不必做方差齐性检验可不必做方差齐性检验8/30/202440基础医学]医学统计学 总体方差不等时的两样本总体方差不等时的两样本 t’检验检验((2))•t’检验检验•检验统计量检验统计量 t’ 为:为:•效正临界值效正临界值t’α为:为:8/30/202441基础医学]医学统计学 总体方差不等时的两样本总体方差不等时的两样本 t’检验检验((2))•例:两组小白鼠,分别饲以高蛋白和低蛋白饲例:两组小白鼠,分别饲以高蛋白和低蛋白饲料,料,4周后记录小白鼠体重增加量(周后记录小白鼠体重增加量(g)如下,)如下,比较两组小白鼠增重均数是否不同?比较两组小白鼠增重均数是否不同?–编号编号 1 2 3 4 5 6 7 8 9 10 11 12 13– X1 50 47 42 43 39 51 43 48 51 42 50 43 – X2 36 38 37 38 36 39 37 35 33 37 39 34 368/30/202442基础医学]医学统计学 总体方差不等时的两样本总体方差不等时的两样本 t’检验检验((3))•方差齐性检验方差齐性检验–建立检验假设,确定检验水准建立检验假设,确定检验水准•H0::σ12=σ22•H1::σ12≠σ22–计算检验统计量计算检验统计量–确定确定P值,作出统计推论值,作出统计推论•υ1=n1-1=12-1=11 υ2=n2-1=13-1=12•F0.05((11,,12))=3.34,,F>F0.05((11,,12)),,P<0.05, 有统计学意义有统计学意义.8/30/202443基础医学]医学统计学 总体方差不等时的两样本总体方差不等时的两样本 t’检验检验((4))•t’检验检验–建立检验假设建立检验假设•H0::µ1=µ2•H1;;µ2 µ2–计算检验统计量计算检验统计量–确定确定P值,作出推断结论值,作出推断结论•t’>t’0.05, P<0.05,, 差异有统计学意义差异有统计学意义8/30/202444基础医学]医学统计学 第四章第四章 方差分析方差分析•第一节第一节 完全随机设计的方差分析完全随机设计的方差分析•第二节第二节 随机区组设计的方差分析随机区组设计的方差分析•第三节第三节 多个样本均数的多重比较多个样本均数的多重比较•第四节第四节 析因设计的方差分析(略)析因设计的方差分析(略)8/30/202445基础医学]医学统计学 第一节第一节 完全随机设计的方差分析完全随机设计的方差分析((1))•完全随机设计的数据结构完全随机设计的数据结构•处理分组处理分组 观察值观察值 组均值组均值 样本容量样本容量• 1 X11,,X12,, …X1n1 x1 n1• 2 X21,,X22,,…X2n2 x2 n2• …… ……. ….. ….• c Xc1,,Xc2,,… Xcnc xc nc8/30/202446基础医学]医学统计学 第一节第一节 完全随机设计的方差分析完全随机设计的方差分析((2))•完全随机设计资料的方差分析表完全随机设计资料的方差分析表•变异来源变异来源 平方和平方和 自由度自由度 均方均方 F• 总变异总变异 N-1 • 组间组间 c-1 SSTR/υTR MSTR/MSe• 组内组内 N-c SSe/υe8/30/202447基础医学]医学统计学 第一节第一节 完全随机设计的方差分析完全随机设计的方差分析((3))•例:为探讨一氧化碳(例:为探讨一氧化碳(NO)在肾缺血再灌流过程中的作用,将)在肾缺血再灌流过程中的作用,将36只雄性只雄性SD大鼠随机分为大鼠随机分为3组给予不同处理后,测得组给予不同处理后,测得NO数据如下。

      试问各组数据如下试问各组NO水平是否相同?水平是否相同?• 正常对照组正常对照组 肾缺血肾缺血60min组组 肾缺血肾缺血60min再灌流组再灌流组 合合 计计• 437.98 322.75 284.04 • 285.75 464.51 194.90• . . .• 309.60 288.76 219.72 • 338.83 386.67 143.17• n 12 12 12 36• ΣX 4106.78 3943.43 3117.0 11167.21• ΣX2 1436935.867 1329275.534 883943.8218 3650155.2338/30/202448基础医学]医学统计学 第一节第一节 完全随机设计的方差分析(完全随机设计的方差分析(4))•建立检验假设建立检验假设–H0::μ1=μ2=μ3–H1::μi((i=1,,2,,3)不完全相同)不完全相同•计算统计量计算统计量•方差分析表及统计推断(见下张幻灯片)方差分析表及统计推断(见下张幻灯片)8/30/202449基础医学]医学统计学 第一节第一节 完全随机设计的方差分析(完全随机设计的方差分析(5))•方差分析表方差分析表•变异来源变异来源 自由度自由度 平方和平方和 均方均方 F F0.01• 总变异总变异 35 186083.579 •不同处理不同处理 2 46925.95 23462.98 5.564 5.32• 误差误差 33 139157.629 4216.898•按按ν1=2,,ν2=33查附表得查附表得F0.01((2,,33))=5.32•本例本例F> F0.01((2,,33)), P<0.05•故按故按α=0.05水平拒绝水平拒绝H0,接受,接受H1,可以认为三组,可以认为三组NO总体水平不总体水平不同。

      同8/30/202450基础医学]医学统计学 第第2节节 随机区组设计的方差分析(随机区组设计的方差分析(1))•随机区组设计的方差分析表随机区组设计的方差分析表•变异来源 平方和 自由度 均方 F • 总变异 N-1• 因素A c-1 SSA/(r-1) MSA/MSe• 因素B r-1 SSB/(r-1) MSB/MSe• 误差 (c-1)(r-1) SSe/υe•其中校正项8/30/202451基础医学]医学统计学 第第2节节 随机区组设计的方差分析(随机区组设计的方差分析(2))•例例: 将将36只雌性大白鼠按月龄相同、体重接近分为只雌性大白鼠按月龄相同、体重接近分为12组组, 经一段时间注经一段时间注射不同剂量雌激素后的子宫质量见下表。

      试问:射不同剂量雌激素后的子宫质量见下表试问:1.不同组的大鼠间子宫不同组的大鼠间子宫质量是否相同?质量是否相同?2.接受不同剂量注射的大鼠子宫质量是否相同?接受不同剂量注射的大鼠子宫质量是否相同?• 区区 组组 0.2 0.4 0.8 合计合计• 1 83 100 109 292• 2 64 78 111 253• 3 69 79 149 297• . … … … …• 12 62 106 114 282• 合计合计 794 1092 1537 34238/30/202452基础医学]医学统计学 第第2节节 随机区组设计的方差分析(随机区组设计的方差分析(3))•建立检验假设建立检验假设–((1)) H0::μ1=μ2=μ3– H1::μi((i=1,,2,,3)不同剂量组间不完全相同)不同剂量组间不完全相同–((2)) H0::τ1= τ 2= τ 3– H1::τi((i=1,,2,,3)不同种属间不完全相同)不同种属间不完全相同•计算统计量计算统计量8/30/202453基础医学]医学统计学 第第2节节 随机区组设计的方差分析(随机区组设计的方差分析(4))•方差分析表方差分析表• 变异来源变异来源 平方和平方和 自由度自由度 均方均方 F• 总变异总变异 29274.75 35 •不同剂量间不同剂量间 23302.1667 2 11651.0833 53.4769•不同区组间不同区组间 1179.4167 11 107.2197 0.4921• 误差误差 4793.1667 22 217.8712•对关于剂量分组的假设,查附表,对关于剂量分组的假设,查附表,F0.05((2,,22))=3.44<53.4769, P<0.05。

      按按α=0.05水平拒绝水平拒绝H0,接受,接受H1•对不同区组的假设,查附表,对不同区组的假设,查附表,F0.05((11,,22))=2.26>0.4921, P>0.05按按α=0.05水平不能拒绝水平不能拒绝H08/30/202454基础医学]医学统计学 第三节第三节 多个样本均数的多重比较多个样本均数的多重比较q检验法检验法•用于对多个样本均数每两个作比较,检验统计量为:用于对多个样本均数每两个作比较,检验统计量为:•式中式中 为两个对比组的样本均数,为两个对比组的样本均数,Mse是方差分是方差分析中的误差均方(或组内均方),析中的误差均方(或组内均方),nA、、nB为两对比组为两对比组的样本例数,的样本例数,υe为方差分析中误差均方的自由度为方差分析中误差均方的自由度8/30/202455基础医学]医学统计学 第五章第五章 卡方检验卡方检验•第一节第一节 2×2表卡方检验表卡方检验•第二节第二节 行行×列表卡方检验列表卡方检验•第三节第三节 配对资料卡方检验配对资料卡方检验8/30/202456基础医学]医学统计学 第一节第一节 2×2表卡方检验表卡方检验•四格表卡方检验四格表卡方检验•四格表资料卡方检验的连续性校正四格表资料卡方检验的连续性校正•四格表卡方检验的精确概率检验法(略)四格表卡方检验的精确概率检验法(略)8/30/202457基础医学]医学统计学 四个表卡方检验(四个表卡方检验(1))使用卡方检验的基本公式使用卡方检验的基本公式•卡方检验的基本公式为:卡方检验的基本公式为:•这里这里R是是Row(行)的字头,(行)的字头,C是是Column(列)的字(列)的字头,头,ARC是位于是位于R行行C列交叉处的实际频数,列交叉处的实际频数,TRC是位是位于于R行行C列交叉处的理论频数。

      列交叉处的理论频数•nR是是ARC所在的行的合计,所在的行的合计,nC是是ARC所在列的合计,所在列的合计,n是多个样本例数的合计是多个样本例数的合计8/30/202458基础医学]医学统计学 四个表卡方检验(四个表卡方检验(2))•例:某药品检验所随机抽取例:某药品检验所随机抽取574名成年人,研究某抗生名成年人,研究某抗生素的耐药性其中素的耐药性其中179例未曾使用该抗生素,其耐药率例未曾使用该抗生素,其耐药率为为40.78%;而在;而在395例曾使用过该药的人群中,耐药率例曾使用过该药的人群中,耐药率为为45.57%,试问两种人群的耐药率是否一样?,试问两种人群的耐药率是否一样?• 用药史用药史 不敏感不敏感 敏感敏感 合计合计 耐药率(耐药率(%))•曾服该药曾服该药 180 215 395 45.57•未服该药未服该药 73 106 179 40.78• 合计合计 253 321 574 44.088/30/202459基础医学]医学统计学 四个表卡方检验(四个表卡方检验(3))•建立检验假设建立检验假设–H0:两种人群对该抗生素的耐药率相同,即:两种人群对该抗生素的耐药率相同,即л1=л2–H1:两种人群对该抗生素的耐药率不相同,即:两种人群对该抗生素的耐药率不相同,即л1≠л2•计算检验统计量计算检验统计量•查表及统计推断查表及统计推断–χ20.05((1))=3.84,本例,本例χ 2< χ 20.05((1)),,P>0.05–在在α=0.05的检验水准下,接受的检验水准下,接受H0 。

      8/30/202460基础医学]医学统计学 四个表卡方检验(四个表卡方检验(4)) 四格表资料四格表资料χ 2检验专用公式检验专用公式 2×2表格式表格式 B1 B2 合计合计 A1 a b a+b A2 c d c+d a+c b+d n=a+b+c+d8/30/202461基础医学]医学统计学 四格表资料卡方检验的连续性校正(四格表资料卡方检验的连续性校正(1))•在四个表资料中,当在四个表资料中,当n≥40且某一理论值且某一理论值1≤T<5时,须对时,须对χ 2值进行连续性效正值进行连续性效正8/30/202462基础医学]医学统计学 四格表资料卡方检验的连续性校正(四格表资料卡方检验的连续性校正(2))•例:某医学院抽样调查大学四年级和五年级的学生近例:某医学院抽样调查大学四年级和五年级的学生近视眼患病情况,四年级学生的近视率为视眼患病情况,四年级学生的近视率为7.14%,五年级,五年级学生的近视率为学生的近视率为35.71%,试问大学四年级与五年级学,试问大学四年级与五年级学生的近视率是否一样?生的近视率是否一样?• 年级年级 近视近视 非近视非近视 合计合计 近视率(近视率(%))•四年级四年级 2((4.67)) 26((23.33)) 28 7.14•五年级五年级 5((2.33)) 9((11.69)) 14 35.71• 合计合计 7 35 42 16.678/30/202463基础医学]医学统计学 四格表资料卡方检验的连续性校正(四格表资料卡方检验的连续性校正(2))•建立检验假设建立检验假设–H0:四年级与五年级学生的近视眼率相同,即:四年级与五年级学生的近视眼率相同,即л1=л2–H1:四年级与五年级学生的近视眼率不相同,即:四年级与五年级学生的近视眼率不相同,即л1≠л2•计算检验统计量计算检验统计量•查表及统计推断查表及统计推断–χ20.05((1))=3.84,本例,本例χ 2< χ 20.05((1)),,P>0.05–在在α=0.05的检验水准下,接受的检验水准下,接受H0 。

      8/30/202464基础医学]医学统计学 四表格卡方检验的确切概率计算法四表格卡方检验的确切概率计算法•在四表格的卡方检验中,若遇到总例数在四表格的卡方检验中,若遇到总例数n<40,或有理,或有理论值论值T<1,即使采用效正公式计算的卡方值亦有偏差即使采用效正公式计算的卡方值亦有偏差因此,因此,R. A. Fisher提出直接计算有利于拒绝提出直接计算有利于拒绝H0的概率,的概率,以作出检验判断以作出检验判断•具体计算方法因较烦琐,此处不做深入介绍具体计算方法因较烦琐,此处不做深入介绍8/30/202465基础医学]医学统计学 第二节第二节 行行×列卡方检验列卡方检验•行×列表的简化计算公式•行×列表的分割–多个实验组间的两两比较–多个实验组与同一对照组的比较8/30/202466基础医学]医学统计学 行行×列表的简化计算公式列表的简化计算公式•行行×列的计算公式如下:列的计算公式如下:•由于上式计算需要先计算理论值,所以显得比较繁琐由于上式计算需要先计算理论值,所以显得比较繁琐行行×列表资料卡方检验还可以用其简化公式:列表资料卡方检验还可以用其简化公式:8/30/202467基础医学]医学统计学 多个实验组间的两两比较(多个实验组间的两两比较(1))•例:某医院用三种治疗方案治疗急性黄疸型病毒肝炎例:某医院用三种治疗方案治疗急性黄疸型病毒肝炎245例,观察例,观察结果见下表,试比较三种疗法的有效率是否一样?结果见下表,试比较三种疗法的有效率是否一样?• 组组 别别 有效有效 无效无效 合计合计 有效率(有效率(%))• 西药组西药组 51 49 100 51.00• 中药组中药组 35 45 80 43.75•中西药结合组中西药结合组 59 15 74 79.73 合合 计计 145 100 254 57.09本例本例χ 2=22.28>χ20.05(2) ,,P<0.05,拒绝,拒绝H0。

      但究竟哪两组之间的有效但究竟哪两组之间的有效率有差别,须进一步作两两组间率的比较率有差别,须进一步作两两组间率的比较8/30/202468基础医学]医学统计学 多个实验组间的两两比较(多个实验组间的两两比较(2))•西药与中药治疗肝炎疗效比较西药与中药治疗肝炎疗效比较• 组组 别别 有效有效 无效无效 合计合计 有效率(有效率(%))• 西药组西药组 51 49 100 51.00• 中药组中药组 35 45 80 43.75• 合合 计计 86 94 180 47.78•查表查表χ20.05((1))=3.84,而,而χ2< χ20.05((1)),则,则P>0.05>0.017,在,在0.017的的水平下不拒绝水平下不拒绝H0。

      8/30/202469基础医学]医学统计学 多个实验组间的两两比较(多个实验组间的两两比较(3))•西药与中西药结合治疗肝炎疗效比较西药与中西药结合治疗肝炎疗效比较• 组组 别别 有效有效 无效无效 合计合计 有效率(有效率(%))• 西药组西药组 51 49 100 51.00•中西药结合中西药结合 59 15 74 79.73• 合合 计计 110 64 174 63.22•查表查表χ20.01((1))=6.63,而,而χ2>χ20.01((1)),则,则P<0.01<0.017,在,在0.017的水平下的水平下拒绝拒绝H0。

      8/30/202470基础医学]医学统计学 多个实验组间的两两比较(多个实验组间的两两比较(4))•中药与中西药结合治疗肝炎疗效比较中药与中西药结合治疗肝炎疗效比较• 组组 别别 有效有效 无效无效 合计合计 有效率(有效率(%))• 中药组中药组 35 45 80 43.75 中西药结合中西药结合 59 15 74 79.73• 合合 计计 94 60 154 61.04•查表查表χ20.01((1))=6.63,而,而χ2> χ20.01((1)),则,则P<0.01<0.017,在,在0.017的的水平下拒绝水平下拒绝H0。

      8/30/202471基础医学]医学统计学 多个实验组与同一对照组比较(多个实验组与同一对照组比较(1))例:现有三种药物,欲研究其治疗心绞痛的疗效另设一组安慰剂例:现有三种药物,欲研究其治疗心绞痛的疗效另设一组安慰剂作对照,实验结果见下表,试问各组间的心绞痛缓解率是否相同作对照,实验结果见下表,试问各组间的心绞痛缓解率是否相同??•疗疗 效效 缓缓 解解 未缓解未缓解 合合 计计•安慰剂安慰剂 28 70 98• A 药药 51 12 63• B 药药 39 20 59• C 药药 29 29 58•合合 计计 147 131 278•本例本例χ2=47.51>χ20.05(2),,P<0.05,拒绝,拒绝H0。

      但若想进一步知道每种但若想进一步知道每种药物与安慰剂比较其疗效如何,须将三种药物分别与安慰剂比较药物与安慰剂比较其疗效如何,须将三种药物分别与安慰剂比较8/30/202472基础医学]医学统计学 多个实验组与同一对照组比较(多个实验组与同一对照组比较(2))•安慰剂与安慰剂与A药疗效的比较药疗效的比较• 组组 别别 缓解缓解 未缓解未缓解 合计合计 缓解率(缓解率(%))• 安慰剂安慰剂 28 70 98 28.57 A 药药 51 12 63 80.95• 合合 计计 79 82 161 49.07•查表查表χ20.01((1))=6.63,而,而χ2> χ20.01((1)),则,则P<0.01<0.017,在,在0.017的的水平下拒绝水平下拒绝H0。

      8/30/202473基础医学]医学统计学 多个实验组与同一对照组比较(多个实验组与同一对照组比较(3))•安慰剂与安慰剂与B药疗效的比较药疗效的比较• 组组 别别 缓解缓解 未缓解未缓解 合计合计 缓解率(缓解率(%))• 安慰剂安慰剂 28 70 98 28.57 B 药药 39 20 59 66.10• 合合 计计 67 90 157 42.67•查表查表χ20.01((1))=6.63,而,而χ2> χ20.01((1)),则,则P<0.01<0.017,在,在0.017的的水平下拒绝水平下拒绝H0。

      8/30/202474基础医学]医学统计学 多个实验组与同一对照组比较(多个实验组与同一对照组比较(4))•安慰剂与安慰剂与C药疗效的比较药疗效的比较• 组组 别别 缓解缓解 未缓解未缓解 合计合计 缓解率(缓解率(%))• 安慰剂安慰剂 28 70 98 28.57 B 药药 29 29 58 50.00• 合合 计计 57 79 156 36.54•查表查表χ20.01((1))=6.63,而,而χ2> χ20.01((1)),则,则P<0.01<0.017,在,在0.017的的水平下拒绝水平下拒绝H0。

      8/30/202475基础医学]医学统计学 第三节第三节 配对资料卡方检验(配对资料卡方检验(1))•基本公式:•校正公式:–当观察频数b+c<40时,需要对χ2进行校正8/30/202476基础医学]医学统计学 第三节第三节 配对资料卡方检验(配对资料卡方检验(2))•例;在下列资料中,例;在下列资料中,A培养基的阳性培养率为培养基的阳性培养率为36.36%,,B培养基的阳性培养率为培养基的阳性培养率为34.345,试问,试问A、、B两种培两种培养基的阳性培养率是否相同?养基的阳性培养率是否相同?•两种培养基的培养结果两种培养基的培养结果• A培养基培养基 B培养基培养基 合计合计• + – • + 48((a)) 24((b)) 72• – 20((c)) 106((d)) 126• 68 130 1988/30/202477基础医学]医学统计学 第三节第三节 配对资料卡方检验(配对资料卡方检验(3))•建立检验假设建立检验假设–H0:两种培养基的阳性检出率相等:两种培养基的阳性检出率相等–H1:两种培养基的阳性检出率不等:两种培养基的阳性检出率不等•计算检验统计量计算检验统计量•查表及统计推断查表及统计推断–χ20.05((1))=3.84,本例,本例χ 2< χ 20.05((1)),,P>0.05–在在α=0.05的检验水准下,接受的检验水准下,接受H0 。

      8/30/202478基础医学]医学统计学 第六章第六章 非参数检验方法非参数检验方法•第一节第一节 配对资料的秩和检验配对资料的秩和检验•第二节第二节 两样本比较的秩和检验两样本比较的秩和检验•第三节第三节 多个样本比较的秩和检验多个样本比较的秩和检验8/30/202479基础医学]医学统计学 第一节第一节 配对资料的秩和检验(配对资料的秩和检验(1))一一 般般 步步 骤骤•求出各对数据的差值求出各对数据的差值•建立检验假设建立检验假设•编秩次,求秩和编秩次,求秩和–依差值绝对值,从大到小排秩,并按差值的正负,标上正负依差值绝对值,从大到小排秩,并按差值的正负,标上正负号;号;–编秩时,对正负号不同的差数中,若有绝对值相等时,则取编秩时,对正负号不同的差数中,若有绝对值相等时,则取其平均秩次;其平均秩次;–分别求正负秩次之和分别求正负秩次之和T+与与T–,并以绝对值较小者为统计量,并以绝对值较小者为统计量T值•查表,确定查表,确定P值范围值范围–当当n≤25时,可查附表的时,可查附表的T界值表,界值表,T越小,越小,P越小–当当n>25时,可按近似正态分布用时,可按近似正态分布用u检验,其公式为:检验,其公式为: 8/30/202480基础医学]医学统计学 第一节第一节 配对资料的秩和检验(配对资料的秩和检验(2))•例:临床某医生研究白癜风病人的例:临床某医生研究白癜风病人的IL-6指标在白癜风部位与正常指标在白癜风部位与正常部位有无差异,调查的资料如下:部位有无差异,调查的资料如下:• 病人号病人号 白斑部位白斑部位 正常部位正常部位 d=正常正常-白斑白斑 秩次秩次• 1 40.03 88.57 48.54 6• 2 91.13 88.00 -17.13 -3• 3 80.32 123.72 43.40 4• 4 25.32 39.03 13.71 2• 5 19.61 24.37 4.76 1• 6 14.50 92.75 78.25 8• 7 49.63 121.57 71.94 7• 8 44.56 89.76 45.20 5• 合计合计 T+=33 T–=38/30/202481基础医学]医学统计学 第一节第一节 配对资料的秩和检验(配对资料的秩和检验(3))•建立检验假设建立检验假设–H0:差值总体的中位数为:差值总体的中位数为0–H1:差值总体的中位数不为:差值总体的中位数不为0•计算统计量计算统计量–首先计算每个对子的差值首先计算每个对子的差值d ,根据,根据8个个d 的绝对值,由小到大的绝对值,由小到大排秩,并根据排秩,并根据d 的正负号给予正负号。

      然后分别相加正负秩次,的正负号给予正负号然后分别相加正负秩次,得到得到T+=33 ,,T–=3,取较小者为统计量,取较小者为统计量T= T–=3•查表及结论查表及结论–现现n=8,查,查T值表值表T0.05((8))=3~33,,T=3恰好落在界点上,所以恰好落在界点上,所以P≤0.05,按,按α=0.05水准拒绝水准拒绝H0,,可认为白斑部位与正常部位的可认为白斑部位与正常部位的白介素有差异白介素有差异8/30/202482基础医学]医学统计学 第二节第二节 两样本比较的秩和检验(两样本比较的秩和检验(1))一一 般般 步步 骤骤•建立检验假设建立检验假设•编秩号,求秩和编秩号,求秩和–两样本观察值从小到大混合编秩;两样本观察值从小到大混合编秩;–设设n1与与n2分别为两样本的含量,规定分别为两样本的含量,规定n1

      对应的概率值–当当n1与与n2超出超出T界值表的范围时,可按正态近似,用界值表的范围时,可按正态近似,用u检验8/30/202483基础医学]医学统计学 第二节第二节 两样本比较的秩和检验(两样本比较的秩和检验(2))例:例: 无淋巴细胞转移无淋巴细胞转移 有淋巴细胞转移有淋巴细胞转移• 时间(月)时间(月) 秩次秩次 时间时间 (月)(月) 秩次秩次• 12 4.5 5 1• 25 10 8 2• 27 11 12 4.5• 29 12.5 12 4.5• 38 17 12 4.5• 42 19 17 7• 46 20 21 8• 46 21 24 9• 56 23 29 12.5• 60 24 30 14• 34 15• 36 16• 40 18• 48 22• n1=10 T1=162 n2=14 T2=1388/30/202484基础医学]医学统计学 第二节第二节 两样本比较的秩和检验(两样本比较的秩和检验(3))•建立检验假设建立检验假设–H0:两总体分布相同:两总体分布相同–H1:两总体分布不同:两总体分布不同•计算统计量计算统计量–将两样本将两样本24个数据由小到大统一排秩,见上表。

      由于两组有个数据由小到大统一排秩,见上表由于两组有相同的观察值相同的观察值12与与29,所以取平均秩次,在同一组内的可不,所以取平均秩次,在同一组内的可不求平均秩次求平均秩次•查表及结论查表及结论–n1=10,,n2-n1=4,查,查T值表得范围值表得范围91~159现T1=162>159,超,超出范围,出范围,P<0.05,拒绝检验假设,即两组患者的平均生存时间,拒绝检验假设,即两组患者的平均生存时间不同8/30/202485基础医学]医学统计学 第三节第三节 多个样本比较的秩和检验(多个样本比较的秩和检验(1))一一 般般 步步 骤骤•建立检验假设建立检验假设•编秩次,求秩和编秩次,求秩和–将各组数据从小到大统一编秩次,对相等的数值,如分属不将各组数据从小到大统一编秩次,对相等的数值,如分属不同组时应取平均秩次;同组时应取平均秩次;–分别计算各组的秩和分别计算各组的秩和Ti•计算统计量计算统计量•H近似服从自由度近似服从自由度υ=k-1的的χ2分布,按分布,按χ2的界值表确定的界值表确定P的范围8/30/202486基础医学]医学统计学 第三节第三节 多个样本比较的秩和检验(多个样本比较的秩和检验(2))• 患自发性白患自发性白 患移植白血病患移植白血病 患移植白血病患移植白血病• 正常脾正常脾 血病的脾血病的脾 的脾(甲组)的脾(甲组) 的脾(乙组)的脾(乙组) 含量含量 秩次秩次 含量含量 秩次秩次 含量含量 秩次秩次 含量含量 秩次秩次((1)) ((2)) ((3)) ((4)) ((5)) ((6)) ((7)) ((8)) 12.3 18 10.8 8 9.3 1 9.5 2 13.2 22 11.6 13 10.3 3.5 10.3 3.5 13.7 26 12.3 18 11.1 11 10.5 5 15.2 28 12.7 21 11.7 14 10.5 6 15.8 29 13.5 23 11.7 15 10.5 7 16.9 30 13.5 24 12.0 16 10.9 9 17.3 31 14.8 27 12.3 18 11.0 10 17.4 32 12.4 20 11.5 12 13.6 25 n1=8 T1=216 n2=7 T2=134 n3=9 T3=123.5 n4=8 T4=54.58/30/202487基础医学]医学统计学 第三节第三节 多个样本比较的秩和检验(多个样本比较的秩和检验(5))•建立检验假设建立检验假设–H0:四组鼠脾:四组鼠脾DNA含量的总体分布相同含量的总体分布相同–H1:四组鼠脾:四组鼠脾DNA含量的总体分布不全相同含量的总体分布不全相同•计算统计量计算统计量•查表及结论查表及结论–k=4,,υ=k-1=4-1=3,查,查χ2界值表界值表χ20.05((3))=7.81,本例,本例χ2=19.90 > χ20.05((3)), P<0.05, 按按α=0.05水准拒绝水准拒绝H0,接受,接受H1,故认为四组,故认为四组DNA含量有差别。

      含量有差别8/30/202488基础医学]医学统计学 第七章第七章 相关与回归相关与回归•第一节第一节 线性相关线性相关•第二节第二节 线性回归线性回归•第三节第三节 线性相关与回归的区别与联系线性相关与回归的区别与联系•第四节第四节 等级相关等级相关8/30/202489基础医学]医学统计学 第一节第一节 线性相关(线性相关(1))相关系数的计算方法相关系数的计算方法•皮尔森(皮尔森(Pearson)相关法)相关法•原始分数计算法原始分数计算法8/30/202490基础医学]医学统计学 第一节第一节 线性相关(线性相关(2))•例:从某大学生群体中随机抽取例:从某大学生群体中随机抽取12名女大学生组成样名女大学生组成样本,分别测得每个学生得身高和体重,试计算身高与本,分别测得每个学生得身高和体重,试计算身高与体重之间的相关系数体重之间的相关系数•编号编号 身高身高(cm) 体重体重(kg) XY X2 Y2 • 1 152 51 7752 23104 2601• 2 158 46 7268 24964 2116• 3 167 55 9185 27889 3025• . . . . . .• . . . . . .• 12 164 55 9020 26896 3025•合计合计 1998 693 115885 333470 404698/30/202491基础医学]医学统计学 第一节第一节 线性相关(线性相关(3))•解:解:•这里这里r为正值,表示身高与体重呈现正的相关。

      为正值,表示身高与体重呈现正的相关8/30/202492基础医学]医学统计学 第一节第一节 线性相关(线性相关(4))线性相关系数的检验假设线性相关系数的检验假设•直接查表法直接查表法–n=12,,r=0.8342,自由度,自由度υ=12-2=10–查附表,查附表,r0.001((10))=0.823,故,故P<0.001,拒绝,拒绝H0•计算统计量计算统计量tr–查查t值表,得值表,得 t0.001((10))=4.587 tr>t0.001((10),),P<0.001, 结果与查结果与查r值表一致值表一致8/30/202493基础医学]医学统计学 第二节第二节 线性回归(线性回归(1))线性回归方程的计算线性回归方程的计算•其中:其中:8/30/202494基础医学]医学统计学 第二节第二节 线性回归(线性回归(1))•例:有人研究了温度对蛙的心率的影响,建立了下表例:有人研究了温度对蛙的心率的影响,建立了下表所示的资料,试进行回归分析所示的资料,试进行回归分析•对象对象 温度(温度(X)) 心率(心率(Y)) XY X2 Y2• 1 2 5 10 4 25• 2 4 11 44 16 121• 3 6 11 66 36 121• . . . . . .• 9 18 32 576 324 1024•合计合计 90 179 2216 1140 43658/30/202495基础医学]医学统计学 第二节第二节 线性回归(线性回归(2))•在本例中在本例中•带入公式得:带入公式得:••则回归方程为:则回归方程为:8/30/202496基础医学]医学统计学 第三节第三节 线性相关与回归的区别与联系线性相关与回归的区别与联系•区别区别–线性相关表示两个变量之间的相互关系是双向的,线性相关表示两个变量之间的相互关系是双向的,回归则反映两个变量之间的单向关系。

      回归则反映两个变量之间的单向关系•联系联系–如果对同一资料进行相关与回归分析,则得到的相如果对同一资料进行相关与回归分析,则得到的相关系数关系数r与回归方程中的与回归方程中的b正负号是相同的;正负号是相同的;–相关回归可以互相解释相关回归可以互相解释8/30/202497基础医学]医学统计学 第四节第四节 等级相关(等级相关(1))•如果观测资料是等级资料,则可用等级相如果观测资料是等级资料,则可用等级相关来表示两事物之间的关系常用的等级关来表示两事物之间的关系常用的等级相关方法为相关方法为Spearman等级相关,其计算等级相关,其计算公式为:公式为:8/30/202498基础医学]医学统计学 第四节第四节 等级相关(等级相关(2))•例;某医生做了一种研究,欲了解人群中氟骨症患病率与饮水之例;某医生做了一种研究,欲了解人群中氟骨症患病率与饮水之间的关系,结果见下表,试计算等级相关系数间的关系,结果见下表,试计算等级相关系数•地区编号地区编号 饮水中氟含量饮水中氟含量 氟骨症患病率氟骨症患病率 d d2• X 秩次秩次 Y 秩次秩次• 1 0.48 1 22.37 2 -1 1• 2 0.64 2 23.31 3 -1 1• 3 1.00 3 25.32 4 -1 1• 4 1.47 4 22.29 1 3 9• 5 1.60 5 35.00 5.5 -0.5 0.25• 6 2.86 6 35.00 5.5 0.5 0.25• 7 3.21 7 46.07 7 0 0• 8 4.71 8 48.31 8 0 08/30/202499基础医学]医学统计学 第四节第四节 等级相关(等级相关(3))•将将X、、Y分别从小到大编秩,若遇到相同分别从小到大编秩,若遇到相同观测值时,则取平均秩次;观测值时,则取平均秩次;•计算计算d2和和•计算计算rs8/30/2024100基础医学]医学统计学 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.