好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

假设检验基础(2015研).ppt

56页
  • 卖家[上传人]:我***
  • 文档编号:134564670
  • 上传时间:2020-06-06
  • 文档格式:PPT
  • 文档大小:2.71MB
  • / 56 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 5假设检验 引子 1 医学科学研究的特点 医学统计学的任务 风险 假设检验的基础 假设检验的基本思想假设检验的步骤单组样本资料的假设检验假设检验的两类错误假设检验的几个观点 例5 1 某一般中学男生的心率平均值 0 75次 分 标准差 5 0次 分 大规模调查获得 我们通过抽样调查 获得经常参加体育锻炼的某中学100名男生的心率平均值为 问 经常参加体育锻炼的男生心率是否与一般中学男生的不同 未知总体 第二种可能性 已知总体 样本均数与拟比较的总体均数不等有两种可能 抽样误差 本质差异 运动的影响 n 100 第一种可能性 唯证据原则 反证法 假设检验实质是反证法与概率学小概率理论的一个完美结合 什么是假设检验 假设 先预设一种立场 是对总体参数的数值所作的一种陈述 例 认为经常参加体育锻炼的男生心率与一般中学男生的没有差异 即 1 其实质是将样本统计量与已知总体均数 之间差异的原因归结为抽样误差 检验 是一种方法 它一定是利用样本提供的信息 从概率的角度来判断这个假设是正确的 是抽样误造成的 还是错误的 不是抽样误差造成的 下结论 H0 零假设 t界值 t界值 根据P值 得出结论 H1 备择假设 验证假设 建立假设 下结论 预设 0 05 P值 三个重要概念 检验水准 检验统计量概率P值 1 小概率事件原则和检验水准 小概率事件 检验水准 leveloftest 是一个概率值 在假设检验中 定义发生概率 的事件叫小概率事件 将 称为检验水准 应事先确定 一般取值0 05或0 01 选 为0 05只是一种习惯 而不是绝对的标准 概率 2 检验统计量 检验统计量是利用样本数据的多种信息 计算得到的一个综合指标 它可以反应该样本可能存在抽样误差的大小 从而成为决定是否可以拒绝H0的证据 在零假设情况下 统计量服从一个给定的概率分布 如t分布 F分布和分布等 如果算出的检验统计量取值落在该分布的临界值之外 则可认为该零假设的成立是个小概率事件 可下拒绝H0的决定 而且 该检验统计量的绝对值越大 拒绝H0的理由越充分 反之不拒绝H0的理由越充分 3 概率P值 就是根据抽样分布的规律 由H0所规定的总体中作一次随机抽样 实际中得到目前这个样本 甚至包括比这个更偏 更极端样本的累积可能性 换言之 在H0成立的前提下 出现目前检验统计量及更不利于H0成立的统计量的累积概率 也就是H0成立的概率 假设检验的P值 t界值 t界值 关于假设检验的几个观点 根据P值下结论 当P 时 则结论为 按检验水准拒绝H0 接受H1 认为差异有统计学意义 统计结论 可认为 不同或 取值高于 的 专业结论 当P 时 则结论为 按检验水准不拒绝H0 认为差异无统计学意义 统计结论 还不能认为 不同或 取值高于 专业结论 不拒绝H0 只因为此时拒绝H0的证据不足 绝不等同于接受H0 所以下结论时对H0只能说 拒绝 或 不拒绝 而对H1只能说 接受 假设检验的结果只能说明有无统计学意义 statisticalsignificance 而不能说明专业上的差异大小 P值越小只能说明 作出拒绝H0 接受H1的统计学证据越充份 推论时犯错误的机会越小 而与专业上 1 2 的大小无直接关系 当P值接近于 值时 下结论应尤其慎重 5 2假设检验的步骤 建立假设 确定检验水准及单双侧 确定P值 计算检验统计量 作推断结论 拒绝H0 接受H1 认为差异有统计学意义 P P 不拒绝H0 认为差异无统计学意义 假设检验的步骤 建立假设H0 H1确定检验水准 根据专业知识 确定单 双侧检验 5 2 1建立假设检验 确定检验水准 什么是零假设 NullHypothesis 1 一般是作没有差别的假设 又称 原假设 或 无效假设 表示为H0 即H0 某一数值 如 0 2 该假设将差异的原因归结为抽样误差 1 建立假设 提出无效假设和备择假设 什么是备择假设 AlternativeHypothesis 1 与无效假设相对立有差别的假设 由不等号 或 组成 常表示为H1 即H1 某一数值 或 某一数值 某一数值 2 该假设将差异的原因归结为环境因素 或是一种本质差异 2 确定检验水准 由研究者事先确定 表示为 常用的 值有0 01 0 05 是一个概率值 假设原假设为真时 拒绝原假设的概率 又被称为抽样分布的拒绝域 注意 3 根据数据特征和专业知识 确定单 双侧 t临界值 t临界值 问 经常参加锻炼的男生与一般男生心率有何不同 双侧检验 用于推断两总体有无差别时 对两总体间可能存在的两种位置关系均要考虑在内 t临界值 问 经常参加锻炼的男生是否低于一般男生的 2 单侧检验 用于推断两总体有无差别时 仅考虑两总体间可能存在的两种位置关系的一种 一般情况下 如结果不明确时 采用双侧假设H1 某一数值 如 0 双侧 包括 0和 0两方面 如果从专业上能肯定其中一侧是不可能的 则采用单侧对立假设H1 某一数值 如 0 左单侧 H1 某一数值 如 0 右单侧 单侧 双侧检验的描述方法 5 2 2选择检验方法和计算检验统计量 假设检验方法的选择 即检验统计量的选择 要依据以下内容 选择最适当的假设检验方法 检验统计量 有关样本资料的差异性检验 定量资料 前提条件 t Z检验 单样本 两独立样本 配对设计 多独立样本 不满足t检验 方差分析条件的 检验 秩和检验 随机区组资料 析因设计资料 重复测量资料 前提条件 前提条件 2 计算检验统计量 各检验方法都有其相应的检验统计量 不同的检验统计量通常都依据于其特定的抽样分布 举例 5 2 3根据检验统计量的结果作出统计推断 在两个对立的检验假设间二取一的规则是 1 若P 意味着在H0成立的前提下不大可能发生当前 或是更不利的状况拒绝 2 若P 意味着在H0成立的前提下 发生当前状况或是更不利的状况的可能性还是比较大的不拒绝 95 t分布图 最后得出结论 1 根据统计推断的结果 作出统计学结论 指对 假设的H0是否真实 作出判断的过程 即 比较p值和检验水准 得出拒绝或不拒绝无效假设的结论 2 并结合相应的专业知识 给出一个专业的结论 5 3单组样本资料的假设检验 变量变换或秩和检验 两独立样本 假设检验 单样本 配对资料 差值 正态 偏态 对子数 t检验 n 50 正态 偏态 n 50 方差不齐 方差齐 变量变换或秩和检验 t 检验 t检验 例5 1 某一般中学男生的心率平均值 0 75次 分 标准差 5 0次 分 大规模调查获得 我们通过抽样调查 获得经常参加体育锻炼的某中学100名男生的心率平均值为 问 经常参加体育锻炼的男生心率是否与一般中学男生的不同 案例解析 研究目的 差异性比较资料类型 定量资料设计类型 单样本设计 单样本资料Z检验 总体标准差已知 5 0 H0 0H1 0 0 05 统计结论 已知Z 0 05 2 1 96 则P 0 05 故拒绝H0 接受H1 认为 与 0的差别有统计学意义 可认为经常参加锻炼的中学男生人群的心率低于一般人群的心率 专业结论 经常参加体育锻炼有助于增强男生的心功能 检验过程 1 建立假设 确定检验水平 2 计算检验统计量 3 确定p值 作出推断结论 某药物100mg溶解在1L溶剂中 溶解后的标准浓度是20 00mg L 现采用某种测定方法进行溶解实验 重复实验11次获得的药物浓度分别为 20 99 20 41 20 10 21 11 请问 用该种方法测得的药物浓度与标准浓度20 0mg l是否相同 案例5 2 案例解析 研究目的 差异性比较资料类型 定量资料设计类型 单样本设计 正态性检验 单样本资料t检验 该样本来自正态分布的总体 n 11 样本含量较小 H0 20mg L 仪器正常H1 20mg L 仪器不正常 0 05 检验过程 1 建立假设 确定检验水平 2 计算检验统计量 3 确定p值 作出推断结论 统计结论 查t界值表 得t 0 05 2 10 2 228 按 0 05检验水准 拒绝H0 接受H1 认为这种方法测得的药物浓度与标准浓度不同 专业结论 该方法测得的药物总体平均浓度高于标准 该方法的效果欠佳 电脑实现 SPSS 1 正态性检验 正态性检验结果输出 H0 呈正态分布 H1 不呈正态分布 0 10 有建议 当n 2000时 结果以Shapiro Wilk W检验 为准 当n 2000时 结果以Kolmogorov Smirnov D检验 为准 2 单组样本均数t检验 结果输出 两总体均数差及95 CI 用于比较的已知总体均数 置信区间回答了 量 的问题 即总体均数差在哪个位置 差异大小是多少 如本题0 98 0 27 1 70 mg L 而假设检验回答了质的问题 即如果两总体均数间存在着差异 那么比统计学的角度确认这种差异的把握度有多大 如本题P 0 012 注意 总体均数差的置信区间和t检验结果是完全一致性的 同时这两者又互为补充 结果报告 用某仪器测量浓度为20mg L的标准液11次 得样本均数和标准差分别为20 98mg L 1 068mg L 经单样本设计资料t检验 t 3 056 v 10 P 0 012 两总体的均数差及95 CI为0 98 0 27 1 70 mg L 按 0 05的检验水准 拒绝H0 接受H1 认为差异有统计学意义 统计结论 该仪器测得的浓度总体上高于标准液 认为该仪器存在着系统误差 专业结论 5 4假设检验的两类错误和检验功效 假设检验是统计推的重要内容 它是应用数学上的反证法和小概率事件实际推断原则 根据样本统计量对总体作出推断 结论具有概率性 结论的风险性 两类错误 I类错误 typeIerror 弃真 I类错误示意图 以单侧t检验为例 误诊 假阳性 实事 H0为真 II型错误示意图 以单侧t检验为例 漏诊 假阴性 II类错误 typeIIerror 存伪 实事 H0为假 H1为真 假设检验中的两类错误 1 第一类错误 弃真错误 拒绝了实际上存在的H0第一类错误的概率为 2 第二类错误 纳伪错误 不拒绝实际上不存在的H0第二类错误的概率为 定义 通常把1 即拒绝不正确H0的概率称为检验功效 也称把握度 意义是 当两个总体确有差别时 按所规定的检验水准 的水平 能发现这种差异的能力 如1 0 80 理论上100次抽样检验中 平均有80次能够得出差别有统计学意义的结论 一般情况下要求1 在0 80以上 5 4 3检验功效 poweroftest 由于所建立的检验主要是控制犯I类错误 的概率 而对犯II类错误的概率 却无法直接控制 即对一个检验犯II类错误的概率究竟怎样无所而知 要谨慎对待 不拒绝H0 的结论 即 阴性结果 因此 Power值的大小已成为某些国际会议审查论文设计内容之一 有的已明确规定 若研究者根据P 0 05下阴性结论时 必须提供Power值 检验水准 定的越大总体参数间的差异越大个体差异 标准差 越小样本含量越大 5 4 4影响检验功效的因素 检验功效越大 1 越大 越小 则Power越大 只有通过增加样本含量 你才可能同时减少两类错误 样本含量一定时 和 的关系就像翘翘板 小 就大 大 就小 当样本量取定时 要减小b 应把a取大一些 2 总体参数间的差异越大 Power越大 3 个体差异越小 Power越大 若两样本总体确有差异时 在一定范围内 样本含量n越大 Power越大 通过增大n的方法 达到增大Power的目的 检验功效 样本含量估算常用软件 SASnQueryAdvisorEGRETSIZSamplepowerSASAPASSEXCEL PASS poweranalysisandsamplesize 是Jerry开发的专业样本含量估算和效能分析软件 PASS可以对均数间的比较 方差分析 相关和回归分析 计数资料的假设检验和病例随访资料分析等检验条件下的检验效能和样本含量进行估计 小结 假设检验是依据样本提供的有限信息对总体做推断的过程 假设检验的步骤为 建立假设 计算统计量 确定p值 作出推断结论假设检验的基本思想是。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.