统计学知识点(完整)--修订编选.pdf
10页基本统计方法基本统计方法 第一章第一章 概论概论 1. 总体(总体(Population)):根据研究目的确定的同质对象的全体(集合) ;样本(样本(Sample)): 从总体中随机抽取的部分具有代表性的研究对象 2. 参数(参数(Parameter)):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表 示,是固定的常数 ; 统计量(统计量(Statistic)) : 反映样本特征的统计指标,如样本均数、标准差等, 采用拉丁字字母表示,是在参数附近波动的随机变量 3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料 第二章第二章 计量资料统计描述计量资料统计描述 1. 集中趋势:均数(算术、几何) 、中位数、众数 2. 离散趋势:极差、四分位间距(QR=P75-P25) 、标准差(或方差) 、变异系数(CV) 3. 正态分布特征 : X 轴上方关于 X=对称的钟形曲线 ; X=时, f(X)取得最大值 ; 有两个 参数, 位置参数和形态参数; 曲线下面积为 1, 区间的面积为 68.27%, 区间1.96 的面积为 95.00%,区间2.58的面积为 99.00%。
4. 医学参考值范围的制定方法:正态近似法:;百分位数法:P2.5-P97.5 /2 XuS 第三章第三章 总体均数估计和假设检验总体均数估计和假设检验 1. 抽样误差(抽样误差(Sampling Error)):由个体变异产生、随机抽样造成的样本统计量与总体参 数的差异抽样误差不可避免,产生的根本原因是生物个体的变异性 2. 均数的标准误(均数的标准误(Standard error of Mean, SEM)):样本均数的标准差,计算公式: 反映样本均数间的离散程度,说明抽样误差的大小/ X n 3. 降低抽样误差的途径有:通过增加样本含量 n;通过设计减少 S 4. t 分布特征: 单峰分布,以 0 为中心,左右对称; 形态取决于自由度,越小,t 值越分散,t 分布的峰部越矮而尾部翘得越高; 当逼近,逼近, t 分布逼近 u 分布,故标准正态分布是 t 分布的特例 X S X 5. 置信区间(置信区间(Confidence Interval, CI)):按预先给定的概率(1-)确定的包含总体参数的 一个范围,计算公式:或95%CI 含义含义:从固定样本含量的已知 /2,X XtS /2,X XuS 总体中进行重复抽样试验,根据每个样本可得到一个置信区间,则平均有 95%的置信区间 包含了总体参数。
6. 假设检验的基本原理:小概率反证法的思想假设检验的基本原理:小概率反证法的思想 反证法:从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立 小概率事件 : 在 H0成立的条件下计算检验统计量, 根据概率分布确定检验水准下 P 值大小,判断是否为小概率事件(通常 P视为小概率事件,通常取) ,是则拒绝 H0, 接受 H1;否则尚不能拒绝 H0 7. 假设检验一般步骤 : 建立假设(反证法,H0和 H1) ,确定检验水准() ; 计算统计量 : u, t,F;确定概率值 P,做出推断结论 8. t 检验需满足的条件:比较的两个样本相互独立独立、均服从正态正态分布 9. P 的含义:的含义:是指从 H0规定的总体随机抽样,抽得等于及大于(或/和等于及小于)现有样本 获得的检验统计量(如 t、u 等)值的概率 10. 型错误(型错误(Type error)):拒绝了实际上成立的 H0,这类“弃真”的错误称为型 错误,型错误的大小为检验水准 型错误(型错误(Type error)):接受了实际上不成立 的 H0,这类“存伪”的错误称为型错误,型错误的大小用 表示,1- 表示检验效能。
越小, 越大,增大样本量可以同时降低 和 11. 置信区间和假设检验的区别和联系:可以通过判断置信区间是否包含零假设,判断单 样本均数是否来自已知的总体 ; 置信区间不但能回答差别有无统计学意义,还可提示差别 有无实际意义假设检验可提供置信区间不能提供的信息,如 P 值和检验效能等 第四章第四章 方差分析方差分析 1. 方差分析的基本思想方差分析的基本思想:根据研究目的和设计类型,把所有测量值的总变异按照处理因素处理因素 和水平水平等分解成两部分 (组内变异和组间变异) 或更多部分, 同时把对自由度相应进行分解, 再进行比较,评价由处理因素引起的变异是否具有统计学意义 2. 方差分析的应用条件:各样本是相互独立独立的随机样本,均来自正态正态分布的总体,各样本 的总体方差相等(具有方差齐性方差齐性) 3. 方差分析表: 变异来源变异来源SSMSFP 组间变异组间变异ag-1a/(g-1)MS组间/MS组内 组内变异组内变异bN-gb/(N-g) 总变异总变异a+bN-1 4. g=2 时,随机区组设计的方差分析与配对设计资料 t 检验等价,tF 5. 多个样本均数间的多重比较:LSD-t 检验检验,即最小显著差异 t 检验,适用于一对或几对 在专业上有特殊意义的样本均数间的比较;Dunnett-t 检验检验:适用于 g-1 个实验组与一个 对照组均数差别的多重比较;SNK-q 检验检验:适用于多个样本均数两两之间的全面比较。
第五章第五章 计数资料的统计描述计数资料的统计描述 1. 相对数的类型:强度相对数(率,如死亡率、发病率等) ;结构相对数(构成比) ;相对 比(如性别比等) 2. 应用相对数的注意事项:结构相对数不能代替强度相对数;计算相对数应有足够的数 量;正确计算合计率;注意资料的可比性;对比不同时期资料应注意客观条件是否相 同;样本率(或构成比)的抽样误差 3. 标准化率(标准化率(Standardization rate)):采用标准化法进行计算,消除数据内部构成的差异, 使标化后的合计率具有可比性,这种经过标化后的合计率称为标准化率 4. 标准化率的注意事项:只适用于内部构成不同,影响总率的可比性的问题;选择的标 准不同,计算得到的标准化率也不同,多个标准化率比较时,应选同一标准 ; 标准化率已 经不再反映当地的实际水平 ; 样本标准化率是样本值,存在抽样误差比较两样本标准化 率,当样本量较小时,需做假设检验 第六章第六章 几种离散型变量的分布及应用几种离散型变量的分布及应用 1. 二项分布 XB(n, )的适用条件:每次试验只发生两种对立的可能结果之一;每次试 验产生某结果的概率固定不变;重复试验是相互独立的。
2. 二项分布的性质 : 阳性次数 X 的总体均数 () 、 标准差 () ; 样n(1)n 本率 p 的均数 () 、 标准差 (, 即率的标准误率的标准误) 二项分布的正态近似 p (1) p pp S n 条件:np 和和 n(1-p)均大于均大于 5 3. 泊松分布泊松分布 XP( )的性质的性质 : 总体均数和总体方差2相等 ; 当 n 很大,很小,且 np= 为常数时,二项分布近似泊松分布 ; 20 时,泊松分布近似正态分布 ; 泊松分布具备可 加性 第七章第七章 2检验检验 1. 2检验的基本思想检验的基本思想:根据2分布特征,通过比较实际频数与理论频数的差异,确定在 成立的条件下该差异由抽样误差造成是否为小概率事件,进而判断差异是否具有统计学意 义2值反映了实际频数与理论频数的吻合程度 2. RC 列联表中的各格子 T1,并且 1T5 的格子数不宜超过 1/5 格子格子总数,否则可能产 生偏差处理方法有三种:增加样本量,使理论频数增大;根据专业知识,删除或合并 行列;采用 Fisher 确切概率法分析 3. 有序分组资料表线性趋势检验: 双向无序的双向无序的 RC 列联表列联表:多个样本率的比较采用 RC 列联表的2检验;两个分类变量 的关联性分析则采用 RC 列联表的2检验和 Pearson 列联系数进行分析。
单向有序的单向有序的 RC 列联表列联表:行有序而列无序:RC 列联表的2检验;行无序而列有序, 采用 Wilcoxon 秩和检验 双向有序属性相同的双向有序属性相同的 RC 列联表列联表:配对四格表的扩展,采用一致性检验(Kappa 检验) 双向有序属性不同的双向有序属性不同的 RC 列联表列联表:样本率的比较采用 Wilcoxon 秩和检验;相关性分析 采用 Spearman 相关分析;线性变化趋势分析采用有序分组资料的线性趋势检验或 CMH2 检验等 第八章第八章 非参数检验非参数检验 1. 秩和检验的适用范围:总体分布偏态的计量资料;数据两端有不确定值;等级资料; 各组离散程度相差悬殊,总体方差不齐的资料 2. 非参数检验对总体分布的形状差别不敏感,只对总体分布位置差别敏感;非参数检验没 有充分利用资料信息,较参数检验的检验效低故能用参数检验尽量采用参数检验,不满 足参数检验条件才使用非参数检验 能用参数检验尽量采用参数检验,不满 足参数检验条件才使用非参数检验 3. 不同数据类型的统计分析路径不同数据类型的统计分析路径: (1)样本均数与总体均数的比较:正态,样本均数与总体均数的 t 检验;非正态,Wilcoxon 符号秩检验。
(2)两样本均数比较:独立正态:两独立样本 t 检验;独立非正态:两独立样本的 Wilcoxon 秩和检验;配对设计差值正态,配对 t 检验;配对设计差值非正态,Wilcoxon 符号秩检验 (3)多样本均数比较:独立正态(方差齐) ,方差分析;独立非正态 Kruskal-Wails H 检验;非独立正态,重复测量资料的方差分析;非独立非正态,Friedman M 检验 第九章第九章 双变量回归和相关双变量回归和相关 1. 直线回归应满足的条件直线回归应满足的条件:自变量与因变量呈线性关系、观察值之间相互独立、因变量 Y 随机正态、 对任何 X 因变量 Y 的标准差相等 直线回归方程回归方程的一般形式为 :, YabXa 为截距,为回归系数,回归系数的估计采用最小二乘法最小二乘法原则(Least Squares Method,使b 残差平方和最小)进行估计 2. 决定系数 (决定系数 (coefficient of determination)) : 回归平方和与总平方和的比值, R2=SS回/SS总 R2 取值 01 之间无单位,其数值大小反映回归贡献的相对程度,即总变异中回归模型能够解 释的百分比。
3. 秩相关的应用适用范围:(1)不服从双变量正态分布而不宜作 Pearson 相关分析;(2) 总体分布型未知;(3)等级资料的相关分析 4. 相关与回归的区别与联系区别相关与回归的区别与联系区别 ((1)区别)区别: 资料:回归分析资料要求 Y 为正态随机变量,X 为选定变量;相关分析资料 X、Y 服从 双变量正态分布 应用:回归分析是由一个变量值推算另一个变量值(依存关系) ;相关分析只反映两个变 量间的相互关系 回归系数 b 与原度量单位有关,而相关系数 r 无关b 的绝对值越大,回归直线越陡, 即 X 变化 1 个单位时 Y 的平均变化越大;r 的绝对值越大,所有点越趋近于一条直线,两变 量的关系越密切,相关度越高 ((2)联系)联系: r 与 b 值可相互换算,; YYXX llbr r 与 b 正负号一致; r 与 b 的假设检验等价:对于同一资料,检验完全等价; br tt 回归可解释相关相关系数的平方 r2(决定系数)是回归平方和与总的离均差平方和之比 (SS回/SS总) 5. 应用直线回归时的注意事项 (1)作回归分析要有实际意义,不能把毫无关联的两种现象作回归分析,必须对两种现象 间的内在联系有所认识。
(2)在进行直线回归分析之前,应绘制散点图,当观察点的分布有直线趋势时,才适宜作 直线回归分析, 散点图还能提示资料有无异常点 异常点的存在往往对方程中的系。

卡西欧5800p使用说明书资料.ppt
锂金属电池界面稳定化-全面剖析.docx
SG3525斩控式单相交流调压电路设计要点.doc
话剧《枕头人》剧本.docx
重视家风建设全面从严治党治家应成为领导干部必修课PPT模板.pptx
黄渤海区拖网渔具综合调查分析.docx
2024年一级造价工程师考试《建设工程技术与计量(交通运输工程)-公路篇》真题及答案.docx
【课件】Unit+3+Reading+and+Thinking公开课课件人教版(2019)必修第一册.pptx
嵌入式软件开发流程566841551.doc
生命密码PPT课件.ppt
爱与责任-师德之魂.ppt
制冷空调装置自动控制技术讲义.ppt


