
样本容量与风险培训教程.ppt
26页5.5.1 1样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日第第5部分部分:样本容量与风险样本容量与风险5.5.2 2样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日目的:目的:目标目标: 1. 说明需要确定合理样本数量的输入量(α风险、β 风险、标准差 、精确度)2. 使用输入量确定比较两个总体所需的合理样本数量本章主要目的是为连续数据类项目确定合理的样本容量第第5部分部分: 样本容量与风险样本容量与风险5.5.3 3样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日总体和样本的区别总体和样本的区别总体总体 - 所有相关项目所有相关项目举例 - 1998年5月在Decatur生产的16立方英尺冰箱样本样本 - 代表总体的数据子集 举例 - 1998年5月在Decatur生产的120台16立方英尺冰箱 举例:此矩阵图代表25个X的总体 划圈的X代表总体中的6个X样本5.5.4 4样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日为什么仅使用样本而非整个总体?为什么仅使用样本而非整个总体?•减少时间和成本•估计难于捕获的总体(合理的样本数量可以提供总体的精确估计) 何时应使用样本?何时应使用样本?•确定工序底线•控制工序的变化 如何确定样本的容量?如何确定样本的容量?•采用样本容量表•选择样本数量提供一个特定长度的置信区间。
选择样本容量需要在置信度选择样本容量需要在置信度与成本之间平衡与成本之间平衡样本样本样本样本....…....…为何使用为何使用为何使用为何使用? ?5.5.5 5样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日Some possible solutions:1. 仅检验一个部件如果同时检验两个部件并得到不同的结果,那么你将不知道哪一结果真实2. 检验三个样本,如果先检验的两个结果不一致,增加第三次检验作为参考3. 通常采用30 个部件进行工序能力的研究,主要目的是估测标准差 4. 当使用计算机模拟时,使用的样本数量超过1,000,000这些观测成本较低,因此很容易采集到大量数据我们应采用多大的样本容量?我们应采用多大的样本容量?没有哪种经验性的规则能够放之四海而皆准,而要根据具体情况确定样本容量特定情况是:•固有变差变差 ()•要求的精确精确度()•要求的置信置信度 (如95%)•成本成本 (时间和资金)本章将介绍确定样本容量的方法本章将介绍确定样本容量的方法对样本容量的一点想法对样本容量的一点想法对样本容量的一点想法对样本容量的一点想法5.5.6 6样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日 风险-当风险-当H0为真时拒绝为真时拒绝Ho -- 有时称为厂商风险。
有时称为厂商风险 风险-风险-当当H0为伪时没能拒绝为伪时没能拒绝Ho -- 有时称为消费者风险有时称为消费者风险 真值真值 决定决定Ho, =Ha, 不=Ho, =Ha, 不 =1类错误 2类错误 正确正确决定决定正确正确决定决定1 = 功效发现差异- 的机率和风险5.5.7 7样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日 使用样本容量表需要使用样本容量表需要使用样本容量表需要使用样本容量表需要了解什么?了解什么?了解什么?了解什么?工序的标准差两个总体平均值的实际差异样本平均值的差值除以标准差 事物相同时却被认为提出不同 (拒绝“ 合格”部件) 产生1类错误的风险 (一般为5%),也称为厂商风险事物不同时却被认为相同 (接受“ 有缺陷” 部件) 产生二类错误的风险,(一般为10%)也称为消费者风险1 - β发现差异的机率术语术语: 检验敏感度检验敏感度 () 1类错误类错误 (α错错误误)α风险风险 2类错误类错误 (β错错误误) β风险风险 功效功效5.5.8 8样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日随着样本容量的增加,实际的总体参随着样本容量的增加,实际的总体参随着样本容量的增加,实际的总体参随着样本容量的增加,实际的总体参数估算值数估算值数估算值数估算值精确度会提高精确度会提高精确度会提高精确度会提高样本平均值的分布样本平均值的分布少量样本 (低n, 高x-bar)多个样本 (高n, 低x-bar)较大的样本容量将减少估算值的误差较大的样本容量将减少估算值的误差5.5.9 9样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日 的定义的定义 小小 的值较大可以提供确定差异的最大能力的值较大可以提供确定差异的最大能力 大 样本平均值之间的距离在下列情况下,很容易看出差异:• 大• 小5.5.1010样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日1.51.41.31.21.11.00.90.80.70.60.50.40.30.20.11.00.90.80.70.60.50.40.30.20.10.0 发现差异的机率发现差异的机率n=4n=16n=32n=64n=128灵敏系数灵敏系数样本容量样本容量(n)增加,发现差异的机率也提高增加,发现差异的机率也提高样本容量样本容量样本容量样本容量( (n)n)对检验机率的影响对检验机率的影响对检验机率的影响对检验机率的影响5.5.1111样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日发现差异的机率发现差异的机率– 随差异随差异 的增加而增大的增加而增大– 随标准差随标准差 的减小而增大的减小而增大1.51.41.31.21.11.00.90.80.70.60.50.40.30.20.11.00.90.80.70.60.50.40.30.20.10.0 发现差异的机率发现差异的机率n=4n=16n=32n=64n=128灵敏系数灵敏系数检验灵敏度检验灵敏度检验灵敏度检验灵敏度( ( / / ) )对检验机率的影响对检验机率的影响对检验机率的影响对检验机率的影响 5.5.1212样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日基本样本容量表基本样本容量表基本样本容量表基本样本容量表仅适用于连续数据仅适用于连续数据仅适用于连续数据仅适用于连续数据Copyright 1995 Six Sigma Academy, Inc.20%10%5%1% 20% 10%5%1%20% 10%5%1%20% 10%5%1%20% 10%5%1%0.2225328428651309428541789392525650919584744891 12020.31001461902891371902413501742342894082603313965340.4568210716377107135197981311622301461862233000.53653691044969871266384104147931191431920.625364872344860884458721026583991340.7182735532535446432435375486173980.8142127411927344925334157364656750.9111621321521273919263245293744591.091317261217223216212637233036481.171114221014182613172130192529401.2691218912152211151826162125331.358101571013199121522141821281.4579136911168111319121518251.546812581014791216101316211.6457105781268101491214191.73569467115791381012171.8345845710568117911151.924573569467106810132.0234734584569679122.1234634574568578112.2234534473458567102.322352346345746792.422352345345645682.512342335334645682.612342335234534572.712242234234534572.812232234233534562.912231234223434463.011231224223433453.111231223223423453.211231223223423353.311221223122323343.411121123122323343.511121123122322343.611121122122322343.711121122122322343.811121112112322233.911121112112222234.01112111211221223通常使用通常使用用于计算n的方程式请参见附录。
5.5.1313样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日要使用图表,我们必须知道要使用图表,我们必须知道 , , ,和和 例例:您的任务是改善冰箱把手的塑料盖直径 •历史数据的平均值 (X)是 2” •目标直径是1.92” •这一过程的0.2 您认为,将温度从250oF升至310oF可使工序回到目标平均值采用5%的和10%的时,需要多少样本才可发现变化? n使用图表举例使用图表举例使用图表举例使用图表举例5.5.1414样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日1. 一个话务员接完一个订购的平均时间是5.6分钟,这个过程的历史标准差是0.8分钟你的任务是找到一种方法,将订购完成时间降低到4.0分钟假定α 风险为5%、β 风险为10%,需要有多少样本才能恰当地估算是否发生了变化2. 假设是1.6,n要求是何值??3. 使用问题1中的初值,要求将呼叫通话时间降低0.32分钟以达到5.28分钟的平均值,这种情况下需要多少样本?要发现较小的变化,需要要发现较小的变化,需要更多的样本更多的样本样本容量练习样本容量练习样本容量练习样本容量练习5.5.1515样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日单样本置信区间 x是样本平均值n是样本容量t(n-1, /2)来自t-表,自由度为n-1, 每个尾为/2s是样本标准差双样本置信区间 x1是第一组样本的平均值x2 是第二组样本的平均值 n1 是第一组样本的平均值n2 是第二组样本的平均值t(n1 + n2 - 2, /2) 来自t-表,自由度为n1 + n2 - 2,每尾为/2sp 是合并的标准差增加样本容量可减小置信区间增加样本容量可减小置信区间置信区间与样本容量置信区间与样本容量 (n)的平方根的平方根成反比成反比样本容量对置信区间的影响样本容量对置信区间的影响样本容量对置信区间的影响样本容量对置信区间的影响5.5.1616样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日您的小组在第一部分已经获取导弹发射器的基线值,这个基线值的获得不应有虚假成分。
以此结果为基础,可以清楚地知道你的现状和目标之间的差距(规范要求导弹发射距离为55 +/- 6英尺)在分析阶段,我们正在寻找潜在的关键少数“ Xs” 现在,我们开始控制过程以便集中搜寻对于这个练习,我们仅使用黄色导弹过程:1.以小组形式决定,希望通过导弹发射器上的哪一个变量X的变化来改进Z值注意注意:不允许改变橡皮圈的方向或扭转橡皮圈!)2. 确定适当的样本容量(样本数容表,第5部分)3.使导弹发射器产生一个一个变化,并在初始设置和新设置下初始设置和新设置下发射合理数量的导弹4.在Minitab中记录 “ Y”结果将数据制图,运行基本统计5.在Minitab中,运行‘ 方差齐性” 检验,确定标准差是否发生变化,运行双样本t-检验确定均值是否发生变化6.变化是否具有实际实际重要性?7.计算原距离与新距离之间差值的双样本置信区间,并计算变化后新距离平均值的单样本置信区间课堂练习课堂练习课堂练习课堂练习:控制导弹发射器:控制导弹发射器:控制导弹发射器:控制导弹发射器5.5.1717样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日小组 __________基准值: n = ___ 平均值 = ____ 标准差 = ___1.您改变了哪个X变量? __________________ 设置是什么? 旧 ________ 新 ___________2.样本容量确定。
= _____ = ______ / = ______ = _____ = ______ n = ________3.收集数据4.改变前: n = ____ 平均值 = ____ s = _____改变后: n = ____ 平均值 = ____ s = _____ 5.波动性的变化是否具有统计显著性?6.平均值的变化是否具有统计显著性?7.这些变化是否具有现实现实重要性?_________________8.平均值变化的置信区间是什么? _____________9.新设置下平均距离的置信区间是什么? ____________课堂练习课堂练习课堂练习课堂练习: : 控制导弹发射器控制导弹发射器控制导弹发射器控制导弹发射器5.5.1818样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日1.是需要检验的各平均值之间的差异大小2检验灵敏度为/ (用于连续数据样本容量表中)3. Alpha()是不存在差异时而声称存在差异的机率。
4. Beta()是未发现重要差异的机率5. 发现差异的机率随以下方面而增加:• 增加样本容量• 增加平均值间的差异• 减小标准变差5. 增加样本容量可减小置信区间的长度关键概念关键概念: 第第5部分部分 样本容量样本容量5.5.1919样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日附录附录5.5.2020样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日•比值较高时,较易看出差异比值较高时,较易看出差异•如果工序变差越大,越难确定差异是偶然如果工序变差越大,越难确定差异是偶然发生,还是确实存在差异,因此,需要更发生,还是确实存在差异,因此,需要更多的样本才能弄清真相多的样本才能弄清真相•每次抽样时,都有可能得出错误的结论每次抽样时,都有可能得出错误的结论 检验灵敏度 = /σ5.5.2121样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日基本的关系基本的关系基本的关系基本的关系常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数注意:表中假设:两组数据之间的比较,固定方差、随机抽样、方差相同,数据服从正态分布。
Copyright 1995 Six Sigma Academy, Inc.5.5.2222样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日实际上不存在差异,而被认为存在差异,这种风险称为风险实际上存在差异,而被认为不存在差异,这种风险称为风险您希望发现的差异大小称为注意注意: 这些准则从本质上说是统计意义上的样本容量选择的其它准则包括成本、时间和可用的资源这些因素对确定样本容量具有实际的影响,因此,根据统计原理确定样本容量之后,还要对这些因素加以考虑,然后,才能估计权衡的充分性样本容量的关键的决定因素样本容量的关键的决定因素样本容量的关键的决定因素样本容量的关键的决定因素5.5.2323样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日 n = 2 (z/2 + z)2 / (/)2/2z2.20.101.282.10.051.645.05.0251.960.01.0052.576z.200.842.101.282.051.645.012.326举例: = .05, /2 = .025, z /2 = 1.960 = .2, z = .842/ = .5n = 2 (1.960 + .842)2 / .52 = 84样本容量方程式样本容量方程式样本容量方程式样本容量方程式5.5.2424样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日您的任务是致力于改进冰箱把手的塑料帽直径,直径μ 是2“,而目标直径μ 是1.92“ ,该过程标准差 = 0.2。
你认为将温度从250°F增加到310°F可以将过程置回到目标平均值上用5% 的α 和10%的β 检测其变化,需要多少样本?确定确定 = 观测的 - 目标 = 2” - 1.92” = 0.08”确定检验灵敏度确定检验灵敏度 ( / ) / = 0.08” / 0.2” / = .4确定总样本数量确定总样本数量 (n)根据以下信息,查看样本容量表: = 5% = 10% / = 0.4n = 1315.135.13页答案页答案页答案页答案5.5.2525样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日1. 话务员完成一次订单的平均时间为5.6分钟,这个过程的历史标准差为0.8分钟你的任务是找到一种方法,将订购完成时间降低到4.0分钟假设α 风险为5%、β 风险为10%,需要多少样本才能适当地估计所产生的变化? = 5.6 分钟 - 4.0 分钟 = 1.6 分钟 / = 1.6 分钟 / 0.8 分钟 = 2n = 52. 假设 是1.6,n要求是何值? = 1.6 分钟 (见上)= 1.6分钟 / 1.6分钟 = 1n = 213. 使用以上的响应变量,要求将呼叫通话时间降低0.32分钟以达到5.28分钟的平均值,这种情况下需要多少样本? = 5.6分钟 - 5.28分钟 = 0.32分钟= 0.32分钟 / 0.8分钟 = 0.4n = 1315.145.14页答案页答案页答案页答案5.5.2626样本容量样本容量GE Appliances Copyright 1999修订版10 1999年1月11日演讲完毕,谢谢观看!。
