好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

全科主治医师-基础知识(2020)讲义0401.pdf

20页
  • 卖家[上传人]:ya****8
  • 文档编号:333424528
  • 上传时间:2022-09-02
  • 文档格式:PDF
  • 文档大小:1.58MB
  • / 20 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1 第四章第四章医学统计学医学统计学 目录 统计学概述 资料特征的描述性分析 资料的统计推断 常用卫生统计指标 统计图表 统计学概述统计学概述 统计学的基本概念(重点掌握)总体总体是根据研究目的确定的同质研究对象(或称观察单位、个体)的总和;或者更确切地说,总体是根据研究目的确定的同质研究对象(或称观察单位、个体)的总和;或者更确切地说,总体是根据研究目的确定的同质研究对象(或观察单位、个体)某种变量值的总和总体是根据研究目的确定的同质研究对象(或观察单位、个体)某种变量值的总和分为有限总体和无限总体有限总体是指总体范围内的个体数是可知的,通常有其时间或空间范围;无限总体则指总体范围内的个体数不可知,有时甚至是抽象的无论是有限总体还是无限总体,在实际的研究中除非有必要,通常都是从总体中抽取部分个体进行观察、研究,并从这一部分个体的情况推论总体状况,这样的研究方法即为抽样研究,所观察或研究的部分个体即为样本样本样本样本是从总体中随机抽取的部分个体随机抽取的意义在于使样本对总体具有代表性,从而使样本是从总体中随机抽取的部分个体随机抽取的意义在于使样本对总体具有代表性,从而使得“由部分个体推论总体”具有科学性和可信性。

      样本中所含的个体数称之为样本含量,得“由部分个体推论总体”具有科学性和可信性样本中所含的个体数称之为样本含量,用符号用符号 n n 表示概率指随机事件发生的可能性的大小,用符号 P 来表示P 值介于 01 之间,P0 表示该事件不会发生,P1 表示该事件必然发生大多数随机事件发生的概率在 01 之间,其 P 值越接近于 1,发生的可能性越大;其 P 值越接近于 0,发生的可能性越小统计学上把统计学上把 P P0.0.0505 或或 P P0.0.0101 的事件称为小概率事件的事件称为小概率事件,即实际中可以认为概率在此范围内的事件几乎不会发生这一小概率事件原理是统计推断的基本原理之一描述总体特征的指标称为参数,如总体均数、总体标准差、总体率等由样本数据计算得到的指标值称为统计量,如中位数 M、样本标准差 s、t 检验统计量 t 值、方差分析统计量 F 值、2检验统计量2值等变量及其分类 变量的概念 变量是指研究中观察单位的某种特征,亦可称为观察指标如一个人的特征可有性别、年龄、身高、血压等,一个家庭的特征可有家庭结构、家庭人均收入、人均居住面积等变量是由变量名和变量值组成的,如性别是变量名,其值为男、女;血压为变量名,其值为 80mmHg 或100mmHg 等。

      变量的分类变量可根据分析内容或其性质进行分类1.按分析内容分类可将变量分为因素性变量和结果性变量如在病人生命质量调查问卷中,反映生命质量的各条目得分是结果性变量,而与生命质量有关的年龄、性别、经济收入即为因素性变量因素性变量也常常作为分组变量2.按变量性质分类(1)数值变量(定量变量、定量指标):变量值是连续的,通常有度量衡单位数值变量(定量变量、定量指标):变量值是连续的,通常有度量衡单位由数值变量构成的资料称为计量资料、定量资料2)分类变量(定性变量、定性指标):表现为不同类别或属性分类变量(定性变量、定性指标):表现为不同类别或属性由分类变量构成的资料称为分类变量资料分类变量资料又可分为计数资料和等级资料计数资料是将观察单位按事物的某种属性或类别分组,再计数各组的观察单位数所得的资料,如性2 别、职业、血型等;等级资料是将观察单位按事物某种属性的不同程度分组,再计数各组的观察单位数所得的资料,它的分组是按等级排序的,具有一定的量的概念,也称之为半定量资料,如尿蛋白检测结果以、等表示或疗效以无效、显效、临床控制、治愈表示等资料类型的转换 一般来说,定量的资料,即数值变量资料可转移为分类变量资料或等级变量的资料。

      如 100 人的血红蛋白值构成一份定量资料,但亦可按医学参考值将其分为正常和贫血,此时即为分类资料;或按不同水平分级分为正常、轻度贫血、中度贫血和重度贫血,此时即为等级资料资料的类型只能从定量向半定量或定性转换,或者从半定量向定性转换,无法反向转换统计分析的基本步骤 1.统计设计统计设计是根据研究目的,按照统计学原理,对整个研究中所涉及的方法学内容作出全面的计划包括研究对象和研究因素的界定、观察指标的选择、抽样方法或实验方法的确定、对照的设立、随机化的分组、样本含量的估计等准备工作的设计;调查表或实验记录表格的设计、研究参与者或调查员的培训、误差的估计和控制等实施阶段的设计;资料整理、录入、分析方法的设计等总结阶段的设计等这是整个统计工作的起点,是后续步骤的依据,是数据分析的前提2.收集资料这是按照统计设计的要求实施调查或试验,获取原始数据的过程医学资料的来源主要有以下两个方面:(1)利用现有资料:包括各类统计报表,如经常性工作记录和既往做过的调查研究报告等2)进行专项调查研究:根据研究目的制订科学、周密的研究计划,按科学研究设计要求,有针对性地收集所需资料3.整理资料通过调查或试验获得的原始数据,往往是没有条理、杂乱无章的,因而整理资料的过程就是使数据条理化、系统化的过程。

      它是统计分析数据的准备阶段,主要包括数据的审核、根据分析目的进行分组整理或编制频数分布表等4.分析资料数据的统计分析包括统计描述和统计推断统计描述就是用适当的指标或统计表、统计图等描述资料的特征统计推断是指用样本信息推断或估计总体状况的过程,包括参数估计和假设检验参数估计即用样本指标估计总体指标,如用样本均数估计总体均数,用样本率估计总体率等;假设检验是运用误差规律,根据概率论原理对要比较的样本指标间的差异或变量间的相互关系作出推论资料特征的描述性分析资料特征的描述性分析 定量资料的统计描述定量资料的统计描述 集中趋势的描述集中趋势的描述 平均数是用于描述一组同质的数值变量集中趋势的一个指标系列,是均数、几何均数、中位数、众数、调和均数等多指标的通称,它反映一组变量值的平均水平它反映一组变量值的平均水平医学研究中常用的平均数有算术均数、几何均数、中位数1.1.算术均数算术均数算术均数简称均数总体均数记作,样本均数记作该指标适用于对称分布,尤其该指标适用于对称分布,尤其是正态或近似正态分布的资料是正态或近似正态分布的资料3(1)直接法:当观察值的个数不多时可直接计算2)加权法:当资料中相同观察值的个数较多时,可用加权法,加权法用于频数表资料。

      式中 f 为组段频数,为组中值组中值组段下限组段上限/2例:对某社区 123 名糖尿病患者餐后 2 小时血糖,用加权法计算平均血糖值组段(mmol/L)(1)频数f(2)组中值 x(3)fx(4)(2)(3)7.0 3 8.5 25.5 10.0 7 11.5 80.5 13.0 11 14.5 159.5 16.0 17 17.5 297.5 19.0 25 20.5 512.5 22.0 26 23.5 611.0 25.0 15 26.5 397.5 28.0 9 29.5 265.5 31.0 6 32.5 195.0 34.037.0 4 35.5 142.0 合计 123 2686.5 2.2.几何均数几何均数记作 G该指标适用于:变量值呈等比级数关系的资料呈等比级数关系的资料,如血清抗体滴度的资料;对对数正态分布的资料数正态分布的资料,即某些偏态分布的资料,当将变量值取对数后又呈现正态分布的资料1)直接法:当观察值的个数不多时可直接计算公式:例:测得 5 人的血清 IgG 抗体滴度为 1:20,1:40,1:80,1:40,1:20,求其平均抗体滴度2)加权法 例:40 名麻疹易感儿接种麻疹疫苗后一个月,血凝抑制抗体滴度,试求其血凝抑制抗体的平均滴度。

      抗体滴度(1)人数f(2)滴度倒数 x(3)lgx(4)flgx(5)(2)(4)1:4 1 4 0.6021 0.6021 1:8 5 8 0.9031 4.5155 1:16 6 16 1.2041 7.2246 1:32 2 32 1.5051 3.0102 4 1:64 7 64 1.8062 12.6434 1:128 10 128 2.1072 21.0720 1:256 4 256 2.4082 9.6328 1:512 5 512 2.7093 13.5465 合计 40 72.2471 3.3.中位数中位数一组按由小到大顺序排列的数据,位次居中的变量值即为中位数,记作 M中位数适用于适用于:明显偏态分布或总体分布型不明的资料;开放型数据,即数据的一端或两端没有界限的资料明显偏态分布或总体分布型不明的资料;开放型数据,即数据的一端或两端没有界限的资料1)直接法:先将观察值按大小顺序排列,然后计算2)频数表法:例:151 例慢性胃炎患者住院时间(天),计算中位住院时间住院天数 频数 累计频数 累计频率(%)0 70 70 46.36 15 54 124 82.12 30 16 140 92.72 45 5 145 96.03 60 4 149 98.68 75 1 150 99.34 90 0 150 99.34 105115 1 151 100.00 4.4.百分位数百分位数以 P表示,一个百分位数 P将总体或样本的全部观察值分成两部分,理论上有的观察值比它小,有(100)%的观察值比它大,故百分位数是一个界值,也是分布数列的百等份分割值,P50 百分位数也就是中位数。

      5.平均数指标的正确应用(1)对称分布(尤其正态或近似正态分布)资料首选均数;(2)对数正态分布资料应首选几何均数,等比级数资料必选几何均数;(3)其他分布情况则使用中位数离散趋势的描述离散趋势的描述 例:三组同性别、同年龄儿童的体重(kg)如下,分析其集中趋势与离散趋势5 定量资料的统计描述 1.1.极差极差(亦称全距)它反映一组观察值的波动范围,记作 R极差是一组数据中最大值与最小值之差该指标数值越大说明变异度越大;反之说明变异度越小它适用于任何分布类型的资料它适用于任何分布类型的资料但因其只受两侧极端值的影响,故反映一组观察值的变异程度时较粗糙,也不够稳定2.2.四分位数间距四分位数间距四分位数间距是上四分位数 QU(P75)与下四分位数 QL(P25)之差,记作 Q该指标的适用条件同中位数,而且通常与中位数(亦称第 50 百分位数)结合,全面描述偏态分布或总体分布不明资料的特征3.3.方差方差总体方差记作2,样本方差记作 S24.4.标准差标准差将方差开平方即为标准差,总体标准差记作,样本标准差记作 s标准差的适用条件与均数相同,而且通常与均数结合全面描述正态或近似正态分布资料的特征。

      标准差越大,说明变量值越分散,即变异度越大5.5.变异系数变异系数记作 CV若各组数据观察指标的度量衡单位不同或虽单位相同但均数相差较大时,则应计算变异系数进行比较例:某地 20 岁男子 100 名,其身高均数为 166.06(cm),标准差为 4.95(cm);体重均数为 53.72(kg),标准差为 3.96(kg)身高与体重的变异度何者为大身高 CV4.95/166.06100%2.98%体重 CK3.96/53.72100%7.37%正态分布及应用正态分布及应用 1.1.正态分布的基本概念正态分布的基本概念正态分布又称高斯分布,是医学和生物界最常见的分布如身高、体重、红细胞数、血红蛋白、血压等的分布均属于正态分布正态分布是以均数为中心,低于均数的人数与高于均数的人数大致相等,越接近均数,人数越多,离均数越远,人数逐渐减少,形成了以均数为中心两侧基本对称的钟形分布这种资料在医学现象中很常见,称为正态分布正态分布具有下列特征:(1)正态曲线在横轴上方,均数处最高2)正态分布以均数为中心,左右对称6(3)正态分布有两个参数,即均数与标准差是位置参数,当固定不变时,越大,曲线越向右移动。

      是变异度参数,不变时,。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.