您所在位置：网站首页 > 办公文档 > PPT模板库 > PPT素材/模板 > 假设检验基础（2015研）

假设检验基础（2015研）.ppt

56页

卖家[上传人]：我***

文档编号：134564670

上传时间：2020-06-06

文档格式：PPT

文档大小：2.71MB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

20金贝

下载

/ 56 举报版权申诉马上下载

文本预览

下载提示

常见问题

5假设检验引子 1 医学科学研究的特点医学统计学的任务风险假设检验的基础假设检验的基本思想假设检验的步骤单组样本资料的假设检验假设检验的两类错误假设检验的几个观点例5 1 某一般中学男生的心率平均值 0 75次分标准差 5 0次分大规模调查获得我们通过抽样调查获得经常参加体育锻炼的某中学100名男生的心率平均值为问经常参加体育锻炼的男生心率是否与一般中学男生的不同未知总体第二种可能性已知总体样本均数与拟比较的总体均数不等有两种可能抽样误差本质差异运动的影响 n 100 第一种可能性唯证据原则反证法假设检验实质是反证法与概率学小概率理论的一个完美结合什么是假设检验假设先预设一种立场是对总体参数的数值所作的一种陈述例认为经常参加体育锻炼的男生心率与一般中学男生的没有差异即 1 其实质是将样本统计量与已知总体均数之间差异的原因归结为抽样误差检验是一种方法它一定是利用样本提供的信息从概率的角度来判断这个假设是正确的是抽样误造成的还是错误的不是抽样误差造成的下结论 H0 零假设 t界值 t界值根据P值得出结论 H1 备择假设验证假设建立假设下结论预设 0 05 P值三个重要概念检验水准检验统计量概率P值 1 小概率事件原则和检验水准小概率事件检验水准 leveloftest 是一个概率值在假设检验中定义发生概率的事件叫小概率事件将称为检验水准应事先确定一般取值0 05或0 01 选为0 05只是一种习惯而不是绝对的标准概率 2 检验统计量检验统计量是利用样本数据的多种信息计算得到的一个综合指标它可以反应该样本可能存在抽样误差的大小从而成为决定是否可以拒绝H0的证据在零假设情况下统计量服从一个给定的概率分布如t分布 F分布和分布等如果算出的检验统计量取值落在该分布的临界值之外则可认为该零假设的成立是个小概率事件可下拒绝H0的决定而且该检验统计量的绝对值越大拒绝H0的理由越充分反之不拒绝H0的理由越充分 3 概率P值就是根据抽样分布的规律由H0所规定的总体中作一次随机抽样实际中得到目前这个样本甚至包括比这个更偏更极端样本的累积可能性换言之在H0成立的前提下出现目前检验统计量及更不利于H0成立的统计量的累积概率也就是H0成立的概率假设检验的P值 t界值 t界值关于假设检验的几个观点根据P值下结论当P 时则结论为按检验水准拒绝H0 接受H1 认为差异有统计学意义统计结论可认为不同或取值高于的专业结论当P 时则结论为按检验水准不拒绝H0 认为差异无统计学意义统计结论还不能认为不同或取值高于专业结论不拒绝H0 只因为此时拒绝H0的证据不足绝不等同于接受H0 所以下结论时对H0只能说拒绝或不拒绝而对H1只能说接受假设检验的结果只能说明有无统计学意义 statisticalsignificance 而不能说明专业上的差异大小 P值越小只能说明作出拒绝H0 接受H1的统计学证据越充份推论时犯错误的机会越小而与专业上 1 2 的大小无直接关系当P值接近于值时下结论应尤其慎重 5 2假设检验的步骤建立假设确定检验水准及单双侧确定P值计算检验统计量作推断结论拒绝H0 接受H1 认为差异有统计学意义 P P 不拒绝H0 认为差异无统计学意义假设检验的步骤建立假设H0 H1确定检验水准根据专业知识确定单双侧检验 5 2 1建立假设检验确定检验水准什么是零假设 NullHypothesis 1 一般是作没有差别的假设又称原假设或无效假设表示为H0 即H0 某一数值如 0 2 该假设将差异的原因归结为抽样误差 1 建立假设提出无效假设和备择假设什么是备择假设 AlternativeHypothesis 1 与无效假设相对立有差别的假设由不等号或组成常表示为H1 即H1 某一数值或某一数值某一数值 2 该假设将差异的原因归结为环境因素或是一种本质差异 2 确定检验水准由研究者事先确定表示为常用的值有0 01 0 05 是一个概率值假设原假设为真时拒绝原假设的概率又被称为抽样分布的拒绝域注意 3 根据数据特征和专业知识确定单双侧 t临界值 t临界值问经常参加锻炼的男生与一般男生心率有何不同双侧检验用于推断两总体有无差别时对两总体间可能存在的两种位置关系均要考虑在内 t临界值问经常参加锻炼的男生是否低于一般男生的 2 单侧检验用于推断两总体有无差别时仅考虑两总体间可能存在的两种位置关系的一种一般情况下如结果不明确时采用双侧假设H1 某一数值如 0 双侧包括 0和 0两方面如果从专业上能肯定其中一侧是不可能的则采用单侧对立假设H1 某一数值如 0 左单侧 H1 某一数值如 0 右单侧单侧双侧检验的描述方法 5 2 2选择检验方法和计算检验统计量假设检验方法的选择即检验统计量的选择要依据以下内容选择最适当的假设检验方法检验统计量有关样本资料的差异性检验定量资料前提条件 t Z检验单样本两独立样本配对设计多独立样本不满足t检验方差分析条件的检验秩和检验随机区组资料析因设计资料重复测量资料前提条件前提条件 2 计算检验统计量各检验方法都有其相应的检验统计量不同的检验统计量通常都依据于其特定的抽样分布举例 5 2 3根据检验统计量的结果作出统计推断在两个对立的检验假设间二取一的规则是 1 若P 意味着在H0成立的前提下不大可能发生当前或是更不利的状况拒绝 2 若P 意味着在H0成立的前提下发生当前状况或是更不利的状况的可能性还是比较大的不拒绝 95 t分布图最后得出结论 1 根据统计推断的结果作出统计学结论指对假设的H0是否真实作出判断的过程即比较p值和检验水准得出拒绝或不拒绝无效假设的结论 2 并结合相应的专业知识给出一个专业的结论 5 3单组样本资料的假设检验变量变换或秩和检验两独立样本假设检验单样本配对资料差值正态偏态对子数 t检验 n 50 正态偏态 n 50 方差不齐方差齐变量变换或秩和检验 t 检验 t检验例5 1 某一般中学男生的心率平均值 0 75次分标准差 5 0次分大规模调查获得我们通过抽样调查获得经常参加体育锻炼的某中学100名男生的心率平均值为问经常参加体育锻炼的男生心率是否与一般中学男生的不同案例解析研究目的差异性比较资料类型定量资料设计类型单样本设计单样本资料Z检验总体标准差已知 5 0 H0 0H1 0 0 05 统计结论已知Z 0 05 2 1 96 则P 0 05 故拒绝H0 接受H1 认为与 0的差别有统计学意义可认为经常参加锻炼的中学男生人群的心率低于一般人群的心率专业结论经常参加体育锻炼有助于增强男生的心功能检验过程 1 建立假设确定检验水平 2 计算检验统计量 3 确定p值作出推断结论某药物100mg溶解在1L溶剂中溶解后的标准浓度是20 00mg L 现采用某种测定方法进行溶解实验重复实验11次获得的药物浓度分别为 20 99 20 41 20 10 21 11 请问用该种方法测得的药物浓度与标准浓度20 0mg l是否相同案例5 2 案例解析研究目的差异性比较资料类型定量资料设计类型单样本设计正态性检验单样本资料t检验该样本来自正态分布的总体 n 11 样本含量较小 H0 20mg L 仪器正常H1 20mg L 仪器不正常 0 05 检验过程 1 建立假设确定检验水平 2 计算检验统计量 3 确定p值作出推断结论统计结论查t界值表得t 0 05 2 10 2 228 按 0 05检验水准拒绝H0 接受H1 认为这种方法测得的药物浓度与标准浓度不同专业结论该方法测得的药物总体平均浓度高于标准该方法的效果欠佳电脑实现 SPSS 1 正态性检验正态性检验结果输出 H0 呈正态分布 H1 不呈正态分布 0 10 有建议当n 2000时结果以Shapiro Wilk W检验为准当n 2000时结果以Kolmogorov Smirnov D检验为准 2 单组样本均数t检验结果输出两总体均数差及95 CI 用于比较的已知总体均数置信区间回答了量的问题即总体均数差在哪个位置差异大小是多少如本题0 98 0 27 1 70 mg L 而假设检验回答了质的问题即如果两总体均数间存在着差异那么比统计学的角度确认这种差异的把握度有多大如本题P 0 012 注意总体均数差的置信区间和t检验结果是完全一致性的同时这两者又互为补充结果报告用某仪器测量浓度为20mg L的标准液11次得样本均数和标准差分别为20 98mg L 1 068mg L 经单样本设计资料t检验 t 3 056 v 10 P 0 012 两总体的均数差及95 CI为0 98 0 27 1 70 mg L 按 0 05的检验水准拒绝H0 接受H1 认为差异有统计学意义统计结论该仪器测得的浓度总体上高于标准液认为该仪器存在着系统误差专业结论 5 4假设检验的两类错误和检验功效假设检验是统计推的重要内容它是应用数学上的反证法和小概率事件实际推断原则根据样本统计量对总体作出推断结论具有概率性结论的风险性两类错误 I类错误 typeIerror 弃真 I类错误示意图以单侧t检验为例误诊假阳性实事 H0为真 II型错误示意图以单侧t检验为例漏诊假阴性 II类错误 typeIIerror 存伪实事 H0为假 H1为真假设检验中的两类错误 1 第一类错误弃真错误拒绝了实际上存在的H0第一类错误的概率为 2 第二类错误纳伪错误不拒绝实际上不存在的H0第二类错误的概率为定义通常把1 即拒绝不正确H0的概率称为检验功效也称把握度意义是当两个总体确有差别时按所规定的检验水准的水平能发现这种差异的能力如1 0 80 理论上100次抽样检验中平均有80次能够得出差别有统计学意义的结论一般情况下要求1 在0 80以上 5 4 3检验功效 poweroftest 由于所建立的检验主要是控制犯I类错误的概率而对犯II类错误的概率却无法直接控制即对一个检验犯II类错误的概率究竟怎样无所而知要谨慎对待不拒绝H0 的结论即阴性结果因此 Power值的大小已成为某些国际会议审查论文设计内容之一有的已明确规定若研究者根据P 0 05下阴性结论时必须提供Power值检验水准定的越大总体参数间的差异越大个体差异标准差越小样本含量越大 5 4 4影响检验功效的因素检验功效越大 1 越大越小则Power越大只有通过增加样本含量你才可能同时减少两类错误样本含量一定时和的关系就像翘翘板小就大大就小当样本量取定时要减小b 应把a取大一些 2 总体参数间的差异越大 Power越大 3 个体差异越小 Power越大若两样本总体确有差异时在一定范围内样本含量n越大 Power越大通过增大n的方法达到增大Power的目的检验功效样本含量估算常用软件 SASnQueryAdvisorEGRETSIZSamplepowerSASAPASSEXCEL PASS poweranalysisandsamplesize 是Jerry开发的专业样本含量估算和效能分析软件 PASS可以对均数间的比较方差分析相关和回归分析计数资料的假设检验和病例随访资料分析等检验条件下的检验效能和样本含量进行估计小结假设检验是依据样本提供的有限信息对总体做推断的过程假设检验的步骤为建立假设计算统计量确定p值作出推断结论假设检验的基本思想是。

点击阅读更多内容