卫生统计学七版常用概率分布
卫生统计学七版常用概率分布目录CONTENTS概率分布基本概念常见离散型概率分布常见连续型概率分布参数估计方法及应用假设检验原理及步骤方差分析在医学研究中应用回归分析在医学研究中应用01概率分布基本概念随机变量与概率分布定义随机变量随机变量是可以随机取不同值的变量,包括离散型和连续型两种。概率分布概率分布用于描述随机变量取值的概率规律,包括概率质量函数和概率密度函数。取值可数的随机变量,如二项分布、泊松分布等。取值充满一个区间的随机变量,如正态分布、指数分布等。离散型与连续型随机变量连续型随机变量离散型随机变量期望描述随机变量取值的平均水平,计算公式为E(X)=x*p(x),其中x为随机变量的取值,p(x)为取该值的概率。方差描述随机变量取值的离散程度,计算公式为D(X)=E(X-E(X)2,其中E(X)为随机变量的期望。期望与方差计算02常见离散型概率分布定义公式性质二项分布二项分布是一种离散型概率分布,描述了在n次独立重复的伯努利试验中,成功次数k的概率分布。其中,每次试验只有两种可能结果(成功或失败),且成功的概率p在每次试验中保持不变。P(X=k)=C(n,k)*pk*(1-p)(n-k),其中C(n,k)表示从n个不同元素中取出k个元素的组合数。二项分布的期望值为E(X)=n*p,方差为D(X)=n*p*(1-p)。泊松分布泊松分布的期望值和方差均为。性质泊松分布是一种离散型概率分布,用于描述在给定时间间隔或空间内发生随机事件次数的概率分布。泊松分布假设事件以恒定的平均速率随机且独立地发生。定义P(X=k)=k*e(-)/k!,其中表示单位时间(或单位面积)内随机事件的平均发生率。公式定义超几何分布是一种离散型概率分布,描述了在不放回的抽样中,从有限总体中抽取n个样本时,其中包含成功样本数k的概率分布。其中,总体中成功的样本数为K,总体样本数为N。公式P(X=k)=C(K,k)*C(N-K,n-k)/C(N,n),其中C(N,n)表示从N个不同元素中取出n个元素的组合数。性质超几何分布的期望值E(X)=n*K/N,方差D(X)=n*K/N*(1-K/N)*(N-n)/(N-1)。超几何分布03常见连续型概率分布正态分布是一种连续型概率分布,其概率密度函数呈钟形曲线,具有对称性和单峰性。定义参数性质应用正态分布有两个参数,分别是均值和标准差,决定了分布的位置和形状。正态分布具有可加性、稳定性、独立性和同分布性。在医学研究中,正态分布常用于描述人体测量指标、生理指标和某些实验数据的分布情况。正态分布参数t分布有一个参数,即自由度,与样本量和总体方差有关。应用在医学研究中,t分布常用于小样本均数的假设检验,如两样本均数比较、配对样本均数比较等。性质t分布的均值为0,方差与自由度有关,且随着的增大而减小。定义t分布是一种连续型概率分布,其形态与自由度有关,当趋近于无穷大时,t分布趋近于标准正态分布。t分布定义F分布有两个参数,分别是第一自由度1和第二自由度2,与分子和分母的卡方分布自由度有关。参数性质应用F分布是一种连续型概率分布,是两个独立的卡方分布变量之比的分布。在医学研究中,F分布常用于方差分析和协方差分析等假设检验方法。F分布的形态与两个自由度有关,当1和2都较大时,F分布趋近于正态分布。F分布04参数估计方法及应用利用样本统计量直接估计总体参数,如样本均值、样本比例等。点估计原理根据样本统计量和抽样分布,构造一个包含总体参数的置信区间,并给出该区间对应的置信水平。区间估计原理点估计与区间估计原理矩估计方法通过匹配样本矩和总体矩,求解总体参数的估计值。该方法简单易行,但精度可能受样本量影响。最大似然估计方法在已知总体分布类型的情况下,选择使得样本出现概率最大的参数值作为估计值。该方法具有优良的大样本性质,但在小样本情况下可能存在偏误。矩估计和最大似然估计方法ABCD估计量评价标准无偏性估计量的期望值等于总体参数真值,即估计量在多次抽样下的平均值接近总体参数。一致性随着样本量的增加,估计量的值逐渐接近总体参数真值。有效性对于同一总体参数的两个无偏估计量,方差较小的估计量更有效。稳健性当总体分布与假设分布存在一定偏离时,估计量仍能保持较好的性质。05假设检验原理及步骤原假设(H0)与备择假设(H1)原假设通常是研究者想要推翻的假设,而备择假设则是研究者希望证实的假设。检验统计量与拒绝域检验统计量是根据样本数据计算出的用于检验原假设的统计量,而拒绝域则是根据显著性水平确定的用于拒绝原假设的区域。显著性水平与P值显著性水平是事先设定的用于判断原假设是否成立的概率阈值,而P值则是根据样本数据计算出的用于衡量原假设成立可能性的概率值。假设检验基本概念两类错误及检验水准设定检验功效是指当备择假设为真时,正确拒绝原假设的概率。检验功效(1-值)第一类错误是指原假设为真时错误地拒绝原假设的概率,而第二类错误则是指原假设为假时未能拒绝原假设的概率。第一类错误(错误)与第二类错误(错误)检验水准是用于控制第一类错误的概率阈值,通常设定为0.05或0.01。检验水准(值)的设定假设检验步骤和结论解读0102031.建立原假设和备择假设。2.选择适当的检验统计量并确定拒绝域。假设检验步骤假设检验步骤和结论解读3.根据样本数据计算检验统计量的值。4.将计算得到的检验统计量值与拒绝域进行比较,作出决策。假设检验步骤和结论解读01结论解读02如果检验统计量的值落在拒绝域内,则拒绝原假设,接受备择假设。03如果检验统计量的值未落在拒绝域内,则不能拒绝原假设。04在解读结论时,需要注意到假设检验的结论是基于样本数据得出的,因此存在一定的不确定性。06方差分析在医学研究中应用通过计算不同组别间的离差平方和与组内离差平方和,比较它们的大小来判断各因素对结果的影响是否显著。方差分析原理各样本须是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等,即具有方差齐性。适用条件方差分析原理及适用条件实例选择选择一项医学研究中的单因素实验设计,如不同药物治疗同一疾病的效果比较。数据收集与整理收集各组样本的观察值,计算各组均值、标准差和离差平方和等统计量。方差分析过程建立假设检验,计算F值,查表得P值,根据P值判断结果是否有统计学差异。结果解释若P0.05,则拒绝原假设,认为不同药物治疗组间的效果存在统计学差异。单因素方差分析实例演示多因素方差分析简介同时考虑两个或多个因素对结果的影响,通过计算各因素及其交互作用的离差平方和来判断它们对结果的影响是否显著。与单因素方差分析的区别多因素方差分析可以分析多个因素对结果的影响,以及各因素之间的交互作用;而单因素方差分析仅考虑一个因素对结果的影响。适用范围适用于医学研究中涉及多个因素的实验设计,如不同药物、不同剂量及不同治疗时间对疾病治疗效果的比较。多因素方差分析概念07回归分析在医学研究中应用03线性回归模型解读解读回归系数、截距及其统计学意义,分析自变量对因变量的影响程度和方向。01线性回归模型基本概念线性回归模型是描述两个或多个变量之间线性关系的统计模型,通过最小二乘法进行参数估计。02线性回归模型建立步骤确定自变量和因变量,绘制散点图观察变量关系,建立线性回归方程,进行参数估计和假设检验。线性回归模型建立与解读常见非线性回归模型类型指数函数、对数函数、幂函数等。非线性回归模型建立与解读通过变量变换或直接拟合非线性模型,解读模型参数及其意义。非线性回归模型概念当自变量与因变量之间呈非线性关系时,需采用非线性回归模型进行拟合。非线性回归模型简介回归模型诊断诊断模型的拟合优度、残差分布、异常值等问题,以确保模型的稳定性和可靠性。模型优化方法通过增加自变量、删除不显著变量、采用逐步回归等方法优化模型。模型评价与比较采用决定系数、调整决定系数、预测误差等指标评价不同模型的优劣,并选择最优模型进行应用。回归模型诊断与优化THANKS感谢您的观看