好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

统计学概念大题.docx

16页
  • 卖家[上传人]:工****
  • 文档编号:410281304
  • 上传时间:2022-10-31
  • 文档格式:DOCX
  • 文档大小:54.53KB
  • / 16 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 一、绪论医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断在研究设计上的错误在数据分析阶段无法更正结果的表达方式主要是统计指标、统计表和统计图统计推断实质有样本数据的特征推断总体特征的方法, 包括参数估计和假设检验参数估计包括点估计和区间估计 区间估计的重要性在于可以得出估计不准的概率假设检验的作用是能够辨别出由随机波动引起差别的概率的大小同质 homogeneity :根据研究目的确定的观察单位,其性质应大致相同Variation :观察同一指标,各观察单位之间由于个体差异,会使测量结果不同,这种差异称为变异,它是 同质基础上的个体差异Variable: 反映观察对象生理生化等特征的指标, 变量的观察值称为数据( data)医学统计学的 研究对象 是具有不确定性结果的事物定量数据 (计量资料) :用定量的数值大小衡量水平高低,一般有计量单位分为连续型(身高、体重)和离散型(脉搏、呼吸)定性数据 (计数资料) : 数据是定性的, 表现为互不相容的类别或属性 如生死、男女有序数据 (等级资料) :数据是定性的,但各类别或属性之间存在排序如痊愈/好转 /有效 / 无效population :根据研究目的确定的所有同质观察对象的全体sample:从总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据error :观测值与真实值、样本统计量与总体参数间的差别parameter:描述总体特征的指标statistics:描述样本特征的指标抽样误差 sampling error :由于个体变异导致的,由于抽样引起样本统计量与总体参数之间的差异二、定量数据的统计描述频数分布表的用途:代替原始资料,便于进一步分析;观察数据的分布类型;便 于发现资料中远离群体的特大或特小值; 当样本含量较大时,可用各组段的频率 作为概率的估计值 正态分布的数据:算数平均数(arithmetic mean)变量取值跨越多个数量级的数据:几何均数(geometric, G )同一组观察值的几何均数总是小于算术平均数偏态数据:适用中位数和百分位数1—■一二1以上为集中趋势的统计指标变异程度的统计指标包括:方差和极差极差(range, R)观测值中最大值和最小值之差四分位间距(quartile range, Q):把所有数据排序后,分成四个数目相等的段落,去掉两端的25%,中间的50%观察值的数据范围即为 Q。

      方差(variance):反映个体变异标准差(standard deviation, S):方差的平方根CV:主要用于不同量纲的变量间,或均数差别较大的变量间变异程度的比较CV越大变异度越大,变异系数(coefficient of variation,) CV=(S/X)x 100%对于正偏态分布的数据,其均数大于中位数三、正态分布与医学参考值范围正态分布的特征:以X=N为中心的单峰分布,左右完全对称;以 X轴为渐近线,两端与X轴不相概率密度函数在X=N时有最大值,在X二N±(T时有拐点N决定曲线的位置,b决定曲线的形状曲线下总面积为1 (100%),任意某一区间下的面积与统一区间上的概率相等X - NZ变换(随机变量的标准化转换)医学参考值范围:“正常”人的解剖、生理、生化指标等数据大多数个体值的波动范围,其统计学含义:从选择的参照总体中获得的所有个体观察值,用统计学方法建立百分位数界限,由此得到个体观察值的波动区间制定医学参考值范围的注意事项:确定同质的参照总体(正常人是指排除了对研 究指标有影响的疾病或有关因素的同质人群)、选择足够例数的参照样本、控制 检测误差、选择单双侧界值、选择适当的百分数范围百分位数法:当分析指标例数较大时分布趋于稳定, 不满足正态分布时使用。

      要 求有较大的样本含量,具适用范围广四、定型数据的统计描述relative number:两个有关的绝对数之比,相对数的性质取决于其分子分母的意rate:表示一定时间或空间范围内某现象的发生数和可能发生的总数之比,说明某现象的强度或频率表示概率大小或可能性proportion :表示某事物内部各组分在整体中所占比重,常以百分数表示,表示 客观存在两者区别在于:某一部分的构成比的增减会影响其他部分,而率不相互影响平均率不能由各率相加后平均求得病死率反应疾病的致死严重程度标准化率:使内部构成不同的数据间具有可比性而引用的相对数相对危险度:表示在两种不同条件下某疾病发生的概率之比比数比:病例组和非病例组中的暴露比例和非暴露比例的比值之比mortality rate :某年某地每千人口中的死亡人数,反映当地居民总的死亡水平,死亡率也称粗死亡率某年某地死亡人口总数同年该地年平均人口数 .age-specificdeathrate:年龄别死亡率某年某地某年龄组死亡人数io 同年该地同年龄别平均 人口数死因别死亡率:反映各类疾病对人群健康的威胁程度某病死亡率 某年某地某病死亡人数 100000/10万同年该地平均人口数死因构成:构成比,反映全部死亡人数中死于某死因者占总死亡人数的百分比Incidence rate:表示一定期间内,一定人群中某病新发生的病例出现的频率,适 用于病程短的疾病或传染病,分母为可能发病的人数Prevalence rate:表示某一时点某人群中还某病的频率,常用于病程长的疾病。

      Case fatality rate:表示某一段期间内,某病患者中因该病死亡的频率,表示该疾 病的严重程度和医疗水平,多用于急性病Cure rate:表示接受治疗的病人中治愈的频率、样本含量小于20,不宜计算相对数五、统计表与统计图直方图(histogram):用直条矩形面积代表各组频数,各矩形面积总和代表各组 频数的总和它主要用于表示连续变量频数分布情况直条图bar chart:用相同宽度的直条长短表示 相互独立的某统计指标值的大小 直条图按直条是横放还是竖放分卧式和立式两种,按对象的分组是单层次和两层 次分单式和复式使用直方图需注意:纵轴的刻度必须从“ 0”开始,而横轴的刻度按实际范围制定各矩形的高度为频数或频率,宽度为组距如果各组段的组距不同要调整 各矩形的高:矩形高度二组段频数/组距绘制直条图时应注意:? 一般以横轴为基线,表示各个标志,纵轴表示各标志相应的值;?纵轴尺度必须从“ 0”开始,而且要等距;?直条的宽度要相等,直条之间的间隔要等距,通常与直条的宽度相 等或略小线图:用线段的升降来表示指标的 连续变化趋势,适用于描述一个变量随另一个 变量变化的趋势横轴和纵轴的刻度都可以不从“0”开始;不应将折线描成光滑 曲线;箱图:用于比较两组或多组资料的 集中趋势和离散趋势,主要适用于偏态分布的 资料。

      箱子的长度表示四分位数间距,两端分别是P75和P25,箱图最外面两端连线表示最大值和最小值,或P5和P95 ,异常值另作标记;箱子越长表示数据 离散程度越大;箱图的中间横线表示中位数,中间横线若在箱子中心位置,表示 数据分布对称,中间横线偏离箱子正中心越远,表示数据分布越偏离中位数误差条图:用于比较多组资料的 均数和可信区间;高度表示均值大小,上下端的 “工字线”分别代表可信区间的上下限;上下限也可以使用标准误;纵轴从“0”开始;各直条宽度相等scatter chart:用点的密集程度和变化趋势来表示两指标之间的相关关系,横轴代表自变量、纵轴代表因变量,两者都可以不从零开始pie chart是以圆形总面积作为100%,将其分割成若干个扇面表示事物内部各构 成部分所占的比例百分比条图(percentage chart)也是一种构成图,用矩形条子的长度表示100%, 而用其中分割的各段表示各构成部分的百分比六、参数估计与假设检验标准差:度量样本观察值与样本均数的离散程度,反映 个体间差异的大小标准误:度量样本均数(统计量)与总体均数(参数)的离散程度,反映 样本问 差异的大小类似标准正态分布,曲线以0为中心,两边对称。

      曲线的变化与自由度V有关自由度V越小,t值越分散,峰越矮,尾越高; 增大,t分布逼近标准正态分布,V趋于8时,t分布趋向标准正态分布t分布的特点:相同自由度时,|t|值越大,尾部概率越小;相同t值时,双侧尾 部概率为单侧尾部概率的两倍准确度(accuracy):反映可信度(1-4的大小,即可信区间包容 小的概率大小, 愈接近1愈好精确度(precision):反映在区间的长度,区间长度愈小精确度愈高a是检验水准,对于可信区间是指它包含总体均数的可能性为95%,而不包含总体均数的可能性仅为5%总体均数可信区间与参考值范用的区别区剂点参考值范围总体均数可信区间含义“1F常人R的弊例'生理r 生化某项将标的波动箝个林伯的波动副国以95%的可信区间为例.盍昧若在同一 息体中作】(HJ次取M抽样.可得10个⑴ 信平均有95个可信区间包含性体 均数,只布"5个可信区何不但含他体均 如/体均数的M能他闺计算公式正态分布:方土%产 偏W分布凸T*上“揄]仃,或1 4展金$¥ n<5U:x 士如工工用途绝大名数(如$5、)现 察对象呆项指标的分布总体均数的区间估计假设检验的原理:小概率反证法对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设 的过程,如果目前不(大)可能发生的情况竟然发生了,说明前提不对。

      假设检验的基本步骤1 .建立假设和确定检验水准 (a取值较小时,有利于提高检验结果的可靠性2 .选择检验方法和统计推断分析:根据资料类型,选择适当的检验方法,并计算 相应的检验统计量3 .确定P值和作出统计推断 (P W”,按a检测水准,拒绝 H0 ,接受H1P >a,现有 样本信息不足以拒绝 H0)最后的统计推断需结合 统计结论和专业结论 进行推断假设检验的思想:对所需要比较的总体提出一个无差别的假设,然后通过样本数据去推断是否拒绝这一假设,实质:判断观察到的“差别”是抽样误差引起还是总体上的不同目的:评价两个不同的参数或两种不同处理引起效应不同的证据具有的强度,这种证据的强度用概率P度量和表示level of test :a取值较小时,有利于提高检验结果的可靠性,但是精密度下降a取值加大时,有利于发现研究总体可能存在的差异,但是其可靠性降低6 .参数估计和假设检验的联系♦参数估计是用样本统计量估计总体参数的 方法,总体参数在估计前是未知的,♦假没检验则是先对总体参数的值提出一个 假设,然后利用样本信息去检验这个假设 是否成立如果成立,我们就接受这个假设, 如果不成立,就放弃它♦假设检验的实质是如何利用样本信息,对 假设成立与否作出判断的一套程序O七、t检验单个样本t检验的目的:推断一个小样本均数所代表的未知总体均数?与已知总体均数 ⑷是否有差别。

      单样本t检验的适用条件:已知一个总体均数;可得到一个样本均数及其标准误;样本来自正态或近似正态总体单样本t检验的适用条件:配对t检验的适用条件配对资料差值的总体需要服从正态分布同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理异源配对:两个同质受试对象 配对,分别接受两种处理方差齐性检验(F检验):由两个样本的方差推断总体方差是否相同要求资料服从正态分布拒绝无效假设则方。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.