电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

计量资料的统计描述幻灯片

77页
  • 卖家[上传人]:m****5
  • 文档编号:51719476
  • 上传时间:2018-08-16
  • 文档格式:PPT
  • 文档大小:568.51KB
  • / 77 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、第 二 节集中趋势的描述指标平均数1 1问题1:以何指标描述改组资料的集中趋势,为什么?2 2问题2:以何指标描述该组资料的集中趋势?如何计算?3 3l一、算术均数(mean)l简称均数。 l总体均数 l样本均数 l1、均数的计算: l 直接法:适用于小样本,n30。l式中为求和符号,n为样本含量,X为 观察值。 4 4例 某地140名正常成年男子红细胞均数为: 加权法:适用于大样本(n30)。 式中X为组中值(本组段下限上限)2 ,f 为相应组段的频数,k 为组段数。计算步骤:编制频数表。列表计算组中值X、fX、fX。将数据代入公式计算均数。 5 5例、 用加权法求某地140名正常成年男子红细胞均数6 6将表中数据代入公式得2、均数的应用 对同质事物求均数才有意义,才能 反映事物的特征。 均数最适用于描述对称分布,特别 是正态分布计量资料的集中趋势。 7 7二、几何均数(geometric mean)1、几何均数的计算: 直接法:即将n个观察值的乘积开n 次方。 为方便运算,写成对数形式推导过程8 8几何均数计算公式推导过程9 9例 10人的血清滴度为12,12,14,14 ,18,

      2、18,18,18,132,132。求 其平均滴度。故其平均滴度为17。1010 加权法:当资料中相同观察值个数( f )较多时,比如频数表资料,可用下式计 算。 例 40名麻疹易感儿童接种麻疹疫苗后 一个月,测其血凝抑制抗体滴度,结果 如下表,求几何均数。1111平均抗体滴度为14812122、 几何均数的应用 几何均数常用于偏态分布资料(观察 值变化范围跨越多个数量级、各观察值呈 倍数关系或服从对数正态分布的资料), 如抗体平均滴度、血清平均效价。 观察值不能有0。因为0不能取对数, 不能与任何数呈倍数关系。 观察值不能同时有正值和负值。若全 为负值,计算时可把负号去掉,得出结果 后再 加上负号。1313三、中位数(median)和百分位数将一组观察值从小到大按顺序排列,位 次居中的观察值就是中位数。 记为M。M百分位数(percentile)是一种位置指标,以Px表示。 百分位数是一个界值。P50是中位数,也是一个特定的百分位数。x 1xPxP50=M14141、中位数和百分位数的计算 直接法计算中位数。先将观察值按大小顺序 排列,再按下列公式计算。 例 某病患者9人,潜伏期(天)

      3、分别为3,4 ,4,5,6,7,7,9,11,求其中位数。 n为奇数,则 (天)15151、 2、 3、 4、 5X1 X2 X3 X4 X51、 2、 3、 4、 5 6X1 X2 X3 X4 X5 X6M = X3 = 3M = (X3 + X4)/2 = (3+4)/2=3.51616例 8名新生儿的身高()为55,58,54 ,50,53,51,54,52,求中位数。先将8个数排序得:50,51,52,53,54,54,55,58 n为偶数,则()1717 利用频数表计算中位数和百 分位数。 式中L为Px所在组段的下限, ix为组距,fx为Px所在组段的频数 ,n为样本含量,fL为小于Px所在 组段的各组段的累计频数。1818计算步骤:1)编制频数表;2)计算累计频数和累计频率;3)确定Px所在的组段;4)将数据代入公式,计算Px 。例 某地630名5060岁正常女性血清甘 油三脂含量资料整理见下表,求P25, P75及M 。1919某地5060岁正常女性血清甘油三脂含量 甘油三脂( mg/dl)频频数累计频计频 数累计频计频 率( )10 27 27 4.340169196

      4、31.170167363 57.6 100 94457 72.5130 81538 85.4160 42580 92.1190 28608 96.5220 14622 98.7250 4626 99.4280 3629 99.8310 1630100.0合计计630202004.357.631.1100MP25P7525502121因25%在4.3%和31.1%之间,故P25在 “40”组段内,则L=40,ix=30,fx=169, fL =27,代入公式,得 同理可求得: 22222、中位数和百分位数的应用 中位数适用于描述任何分布类 型的计量资料,但常用于描述偏态 分布,当分布末端无确定数值或分 布不明的资料,不能计算均数和几 何均数时,应求其中位数。 Px用于描述一组观察值在某百 分位置的水平。2323 Px常用于确定医学参考值范围(reference value range)。医学参考值范围是指特定健康状况的人群( 排除了有关疾病和因素对所研究指标有影响的所 谓“正常人”)的解剖、生理、生化等各种数据的 波动范围。习惯上是确定只包括95%参照总体的范 围。0100%95WBC(

      5、双侧)P 2.5P 97.5 242495尿铅含量的95参考值范围 (单侧)5 955 小大小大肺活量的95参考值范围 (单侧)P95P52525离散趋势的统计描述2626有3组同龄男孩体重(kg)如表1,请对该资料的 特征作出描述。问题: 1、选择适宜指标描述上述资料的离散趋势。 2、为什么说 S 越大,均数的代表性越差? 3、 S 与CV的异同点? 2727第 一 节衡量离散趋势的指标2828一、极差二、方差三、标准差四、变异系数五、四分位数间距2929一、极差 (range) 又称全距 ,用R 表示,是一组数据中最大值与 最小值的差值。意义:全距大说明变异程度大;反之说明变异 程度小。常用于描述样本含量较小的资料的变异程度。如上例:甲34268kg 乙362412kg丙34268kg 3030优点: 极差用来表达变异程度大 小,简单明了 ,计算方便。缺点:计算时只考虑了两个变量 值,不能反映组内所有变量偏 离集中位置的程度 。3131二、方差 (mean of square) 应考虑组内所有数据偏离集中位置 的程度即总体中每个变量值与总体 均数之差(离均差)。32321、平均偏差

      6、(mean difference):甲的平均偏差2.4乙的平均偏差3.6丙的平均偏差2可见,乙的变异程度大。但因为用了绝 对值,数学上不便处理,所以少用。3333简写为SS,描述了每一个变量偏离集中 位置的情况。公式为:2、离均差平方和(sum of square)3、方差(mean of square)将SS取平均值即为方差,简写为MS。3434“n1”称为自由度(degree of freedom),简写为 d f 或 3535三、标准差(standard deviation) 方差的单位是原数据的平方,不利 于进一步统计分析,常用其平方根 标准差SD(或S)替代,用于描述数据 分布的离散程度。3636标准差的意义: 当两组(或几组)资料均数相近、 度量衡单位相同时,标准差大表示变量 值的变异程度大,各变量值离均数较远 ,均数的代表性较差;反之,标准差小 表示变量值的变异程度小,各变量值离 均数较近,均数的代表性较好。可结合均数一起全面描述对称分布 的计量资料,常写作 , 如:170.505.35cm ,3737标准差的计算: (1)直接法 经数学证明,标准差 的计算公式也可写为:

      7、3838甲组组乙组组丙组组XX2XX2XX226 676 24 576 26 67628 784 27 329 29 84130 900 30 900 30 900321024 331089 31 961341156 361296 34 11合计计150(X)4540 (X2)150 (X)4590 (X2)150 (X)4534 (X2)三组男孩体重标准差计算表39394040从表1中分别计算3组男孩体重的标准差 如下:S甲3.1623 kg, S乙4.7434 kg,S丙2.9155 kg 结果说明3组男孩体重平均水平相同, 但变异程度不同,乙组男孩变异程度最大 ,甲组次之,丙组变异程度最小。4141(2)加权法 当样本含量较大时 ,常利用频数表计算标准差。计算公式为: 4242组组段频频数f 组组中值值XfXfX2 3.80 23.90 7.80 30.42 4.00 64.10 24.60 100.86 4.20 114.30 47.30 203.39 4.40 254.50112.50 506.25 4.60 324.70150.40 706.88 4.80 274.9013

      8、2.30 648.27 5.00 175.10 86.70 442.17 5.20 135.30 68.90 365.17 5.40 45.50 22.00 121.00 5.60 25.70 11.40 64.98 5.80 15.90 5.90 34.81 合计计140 669.80 fX3224.20 fX24343求得: fX669.80 fX23224.204444四、变异系数(coefficient of variation) 若比较度量衡单位不同或均数相差悬殊 的两组(或几组)资料的变异程度时,应计 算变异系数。变异系数用CV 表示 。其计算公式如下:4545由此可见,7岁男孩体重的变异程度 大于身高的变异程度。 例1 某地岁男孩身高均数123.10cm ,标准差为4.71cm;体重均数为22.29kg, 标准差为2.26kg,试比较身高、体重何者 变异程度大。 4646表2资料说明,当均数相差较大时, 比较变量值的变异程度,不能用标准差 ,应由变异系数分析,从变异系数可以 看出岁以下儿童随年龄增加,其身高 的变异程度逐渐减小。 4747五、四分位数间距(quartile)简写为Q ,比极差稳定,适用于偏态分 布资料,常和 M 一起描述偏态分布资料的 频数分布特征。P75P25计算公式:Q = P75 P254848计量资料频数分布的特征集中趋势离散趋势算术均数:对称分布几何均数:偏态分布中位数:偏态分布、分布末端无界值极差:小样本 方差:对称分布标准差:对称分布变异系数 单位不同均数相差悬殊 四分位数间距:偏态分布4949正态分布及其应用5050正态分布又称高斯(Gauss)分布, 是最常见、最重要的一种连续型分布, 医学资料中有许多指标的频数分布都呈 正态分布,如身高、体重、脉搏、血红 蛋白、血清总胆固醇等。5151一、正态分布的概念525353545455555656当 n 趋于无穷大, 组距趋于 0, 组段数趋于无穷大时的 频数分布图的顶端逐渐接近一条光滑曲线。此曲线呈 钟型,两头低中间高,左右对称,近似于数学上的正 态分布曲线。5757二图形正态分布密度函数 。5858二、正态分布的特征二、正态分布的特征1 1、 正态曲线以正态曲线以 均数为中心,左均数为中心,左 右对称。右对称。59592、正态

      《计量资料的统计描述幻灯片》由会员m****5分享,可在线阅读,更多相关《计量资料的统计描述幻灯片》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结 2022年家长会心得体会集合15篇
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.