好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

六西格玛教材4022ppt课件.ppt

49页
  • 卖家[上传人]:s9****2
  • 文档编号:578763280
  • 上传时间:2024-08-25
  • 文档格式:PPT
  • 文档大小:2.56MB
  • / 49 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 分析分析(Analyze)阶段阶段 方差分析方差分析( One Way ANOVA ): DefineDefineMeasureMeasureAnalyzeAnalyzeImproveImproveControlControlStep 8- Data 分析分析Step 9- Vital Few X’的的选选定定q Multi Variq Central limitq Hypothesis testingq Confidence intervalq ANOVA, T-testq Chi-squareq Correlation,regressionStep 7- Data 搜集搜集路径位置路径位置: 目 录q ANOVA(方差分析)的概念q One way ANOVA的概念 q ANOVA的原理 q 应用MINITABq 实习 – 弹射器q 再多想一想q 简要及 附录: ANOVA的概念(1) - ANOVA是什么?q 在什在什么么情情况况下使用下使用? ? q当当有有3 3个个以上水平以上水平时检验时检验均均值值差差异异. .qOne way ANOVAOne way ANOVAq当当有有2 2个个以上因子以上因子时检验时检验均均值值的差的差异异. .qTwo, Three … way ANOVATwo, Three … way ANOVAq 用什用什么么原理分析原理分析? ?q把所有把所有实验结实验结果的方差果的方差, ,对对几几个个因子的方差和其他因子的方差和其他误误差差的方差的方差来区来区分分, ,并并分析均分析均值值的差的差异异的方法的方法q利用利用“ “总总方差方差 = = 因子效果的方差因子效果的方差 + + 误误差方差差方差” ”: X X数据数据有有1 1个个X X变量量有多个有多个 X X 变量变量 Y Y 数据数据有有1 1个个 Y Y 变量量 有多个有多个 Y Y变量变量 X DataX Data离散型离散型离散型离散型 连续型连续型Y DataY Data离散型离散型离散型离散型连续型连续型One-way ANOVAOne-way ANOVAOne-way ANOVAOne-way ANOVAMeans/Means/Means/Means/Medians TestsMedians TestsMedians TestsMedians TestsX DataX Data离散型离散型离散型离散型连续型连续型Y DataY Data离散型离散型离散型离散型连续型连续型Chi-SquareChi-SquareRegressionRegressionMultipleMultipleRegressionRegressionMedians TestsMedians Tests2, 3, 4 way...2, 3, 4 way...ANOVAANOVAANOVA的概念(2) - 包含在哪里?当当X X是离散型或连续型是离散型或连续型, Y, Y是连续型变量时使用是连续型变量时使用. . 是对是对““均值是否相等〞的检验方法均值是否相等〞的检验方法: ANOVA的概念(3) – 路径分析包含包含3 3个以上水平个以上水平X X变量的变量的均值比较均值比较稳定性稳定性分布的形态分布的形态分布分布(Spread)(Spread)中心的位置中心的位置 (Centering)(Centering)ANOVAANOVA包含包含2 2个水平的个水平的X X变量均变量均值比较值比较稳定性稳定性分布的形态分布的形态分布分布(Spread)(Spread)中心的位置中心的位置 (Centering)(Centering)包含包含1 1个水平的个水平的X X变量变量均值比较均值比较稳定性研究稳定性研究( (必要时必要时) )分布的形态分布的形态分布分布中心的中心的 位置位置OROR2sample2samplet testt test1sample1samplet testt test: ONE WAY ANOVA的概念(1) – 概要q我们要观察的一个￿input￿变量(因子)有多个样本时,￿我们实际上在实施￿单因子实验￿(Single￿Factor￿Experiment).q我们要分析对象的￿因子是否有水平间的差异q确定3个供应商的平均交货期是否有差异q确定某个机器的设定值在5个水平间变化时,零件的尺寸是否不同q现在开始做第一次实验!q…观察.: ONE ANOVA的概念(2) – 例题o考虑如下情景:一个产品开发工程师要研究某个电阻焊考虑如下情景:一个产品开发工程师要研究某个电阻焊接系统中接系统中5 5种不同的电流设置对焊接强度的影响种不同的电流设置对焊接强度的影响 o她要研究的电流范围为她要研究的电流范围为15-1915-19安培。

      她将调查安培她将调查5 5个水平的个水平的输入变量〔因子):输入变量〔因子): 15A, 16A, 17A, 18A 15A, 16A, 17A, 18A 和和 19A 19A她将对每个水平进行将对每个水平进行5 5次实验次实验 o输出输出: : 焊接强度焊接强度o输入输入: : 电流电流o这是一个具有这是一个具有5 5个水平的单因子实验〔电流)个水平的单因子实验〔电流)o该实验的结果参考下页该实验的结果参考下页. . : One ANOVAOne ANOVA的概念的概念(3) – (3) – 例题例题对于这个设备使用哪个电流,你的结论是什么?为什么?对于这个设备使用哪个电流,你的结论是什么?为什么? : 输入结果输入结果DATA的的 design matrix同下同下.实习实习: 打开窗口打开窗口 Mont52.mtw 制作各列数据的点图制作各列数据的点图.使用对所有变量相同的格式使用对所有变量相同的格式 (SCALE)!ONE ANOVA的概念(3) – 例题: 各均值的各均值的 95% 置信区间置信区间(CI)如下如下.数据堆叠后数据堆叠后 统计统计>方差分析方差分析>区间图区间图对电流和焊接强度的关系做什么结论对电流和焊接强度的关系做什么结论?这结论的置信度是怎样这结论的置信度是怎样?ONE WAY ANOVA的概念(3) – 例题: One ANOVAOne ANOVA的概念的概念(4) – (4) – 假设假设Ha: 至少有一至少有一个水平产生不个水平产生不同过程同过程 H0: 数据只描数据只描述一个过程的述一个过程的自然散布自然散布 你认为答案是什么?为什么?你认为答案是什么?为什么? : One ANOVAOne ANOVA的概念的概念(5) – (5) – 假设假设此设计的数学模型是: l Ho 假设处理项是零假设处理项是零 数学模型假设数学模型假设 常规假设常规假设 Yti = μ+τt+εti其中其中: yti=来来自自处处理理t的的单单个响个响应应 μ=总总平均平均值值 τt=处处理理tεti=随随机机误误差差: ONE ANOVA的概念(6) – 变量选定*输入变量作为一个因子。

      输入变量作为一个因子 在单因子设计中,因子被当作特征变量处理,即使它可在单因子设计中,因子被当作特征变量处理,即使它可能是间隔值或比率能是间隔值或比率 *如果因子自然为连续型的,可以把它分类成子群如果因子自然为连续型的,可以把它分类成子群 - - 例如,我可以采用低和高来度量生产线的压力值例如,我可以采用低和高来度量生产线的压力值 - - 我们可以作中值分离我们可以作中值分离(Median Split)(Median Split)来把因子分成来把因子分成两个水平:低和高两个水平:低和高 - - 对于我们的例子,因为电流是连续型变量,我们把对于我们的例子,因为电流是连续型变量,我们把它分成它分成5 5个等级输出一般以间隔值或比率范围来度量〔合格率,温度,电输出一般以间隔值或比率范围来度量〔合格率,温度,电压,等等〕输出变量可以是分离型或间隔压,等等〕输出变量可以是分离型或间隔/ /比率变量比率变量 : ANOVA的原理 (1) – 总变动q 因子因子A A的水平是的水平是I I个个, ,各水平的反复数都是各水平的反复数都是m m次次, ,则数据矩阵则数据矩阵q 排列成下面的样子排列成下面的样子因子的水平A1 A2 A3 A4 A5 A6 … Al实验的反复x11 x21 x31 x41 x51 x61 … xl1x12 x22 x32 x42 x52 x62 … xl2 x13 x23 x33 x43 x53 x63 … xl3 x14 x24 x34 x44 x54 x64 … xl4 x15 x25 x35 x45 x55 x65 … xl5x1m x2m x3m x4m x5m x6m … xlm合计T1 T2 T3 T4 T5 T6 … TlT均值x1 x2 x3 x4 x5 x6 … xlx: q 总总均均值值 是用右是用右边边的公式求的公式求. . q 利用各利用各个个DATA DATA 和和总总均均值值 把把总总均均值值 分解分解为为两个两个, ,q同下表示同下表示. .q 左左边边和右和右边边平方平方时时同下同下. .ANOVA的原理 (2) – 总变动: q 上面的第三上面的第三项变为项变为如下如下. . SS(total) SS(error) SS(factor)q 同同样样第第8 8页页式式从写从写如下如下, ,这这意意义义的略的略写写SS(Sum of Squares)SS(Sum of Squares)来来表示表示. .ANOVA的原理 (3) – 总变动: SS(total)SS(total)的自由度的自由度 是是, , SS(factor)SS(factor)的自由度的自由度 是是, , SS(error)SS(error)的自由度的自由度 是是, , 因而因而 ANOVA的原理 (4) – 自由度在一个系统中不影响其他变量能够独立移动的数在一个系统中不影响其他变量能够独立移动的数Ex) a*b*c = 4 Ex) a*b*c = 4 这式中变量的自由度是这式中变量的自由度是 2 . 2 . 假设假设 a,b a,b定为定为 1,2, c 1,2, c必须是必须是 2 . 2 . 即能够自然的移动的变量。

      即能够自然的移动的变量q 自由度是?q 自由度的自由度的计计算算: 因子(factor)平方和(Sum of Squares)自由度(Degree of Freedom)均值平方(Mean Square)F值AErrorTotalANOVA的原理 (5) – 方差分析表q 方差分析表的制作q 对错误的均值平方因子,利用A的均值平方的大小q 观察 A效果的大小.q F越大 A效果越大. ( 利用F 分布确认 P-value): ANOVA的原理 (6) – F分布q F F分布的参考分布的参考q 自由度 k1,k2的变量的 F值的 F(k1,k2:α)按 α的大小 占有面积(发生概率). α(显著水平)F(k1,k2)F(k1,k2: α): F-分布分布 65432100.70.60.50.40.30.20.10.0ScoresP rob10%1%5%: q Exercise Exercise某个 coating 工程认为 反应温度对生产的 产品的强度有影响, 所以对反应温度变化强度有什么变化, 还有温度在什么水平时强度最好,进行了实验. 反应温度设为因子水平,各温度反复3回,总共12回实验数据随机整理. 这结果同下表. 制作方差分析表(ANOVA table) . (参考Excel sheet.)ANOVA的原理 (7) – 例题: 因子(factor)平方和(Sum of Squares)自由度(Degree of Freedom)均值平方(Mean Square)F值AErrorTotalq ANOVA table ANOVA tableANOVA的原理 (8) – 例题F F分布表中分布表中 F F是是(3,8:0.05) = 4.07, F(3,8:0.01)=7.59 .(3,8:0.05) = 4.07, F(3,8:0.01)=7.59 .那么那么 A A是显著水平是显著水平 1% 1%中是否采用零假设中是否采用零假设? ?还是推翻还是推翻? ---------- ? ---------- 要推翻要推翻. .: ANOVA的原理 (9) – 统计的假定g输出的总体方差在给定因子所有水平上都相等〔方差均一性输出的总体方差在给定因子所有水平上都相等〔方差均一性 Test for Test for Equal Variance Equal Variance )。

      g 我们可以用统计我们可以用统计> > 方差分析方差分析> > 等方差检验程序来检验这个假设等方差检验程序来检验这个假设 g响应均值是独立的,并服从正态分布响应均值是独立的,并服从正态分布g - - 如果使用随机化和适当的样本数,这个假设一般有效如果使用随机化和适当的样本数,这个假设一般有效 g - - 警告警告: :在化学过程中在化学过程中, ,均值相关的风险很高均值相关的风险很高, ,应永远考虑随机化应永远考虑随机化 g残差〔数学模型的误差〕是独立的,其分布是均值残差〔数学模型的误差〕是独立的,其分布是均值=0=0,方差为恒量的正,方差为恒量的正态分布 q 单一因子实验分析•实验结果移动到实验结果移动到 MINITAB Worksheet. MINITAB Worksheet.•数据有没有异常点利用管理图进行确认数据有没有异常点利用管理图进行确认. (. (稳定性分析稳定性分析) )•利用统计利用统计> > 方差分析方差分析> > 等方差检验程序进行等方差检验等方差检验程序进行等方差检验. . • 方差同一时实施方差同一时实施(p-value <0.05) ANOVA .(p-value <0.05) ANOVA .•用统计用统计> > 方差分析方差分析> >> >单因子方差分析单因子方差分析 进行分析进行分析 . .•所有的数据在所有的数据在1 1列时列时 (Stacked) : One-way (Stacked) : One-way•按水平别数据分几列时按水平别数据分几列时(Unstacked) :(Unstacked) :采用采用 One-way(Unstacked..) . One-way(Unstacked..) . •解释解释F-ratio. F-value F-ratio. F-value 高高 p-value p-value 显著水平时显著水平时( (一般一般 5-10%) 5-10%) 推翻零假设推翻零假设(Ho) (Ho) . . •推翻零假设时推翻零假设时, , 利用统计利用统计> > 方差分析方差分析> >主效应图主效应图 或统计或统计> > 方差分析方差分析> >区间图对区间图对均值差异利用区间图说明均值差异利用区间图说明. . •利用利用Minitab Minitab 的的 Anova Anova 视窗中的视窗中的 残差项目残差项目( (残差残差 Plot) Plot) 对残差实施评价对残差实施评价. . •为测试实际的显著性为测试实际的显著性, ,对有影响的对有影响的 Epsilon-Squared Epsilon-Squared 进行计算进行计算. . •根据分析结果找出方案根据分析结果找出方案. . 应用应用MINITABMINITAB分析分析(1) – (1) – 分析顺序分析顺序: Ø零假设零假设 (Ho): 3名作业者刷漆厚度相同名作业者刷漆厚度相同.Ø备择假设备择假设(Ha): 作业者中至少有一名刷的厚度与其他作业者刷的厚作业者中至少有一名刷的厚度与其他作业者刷的厚度不同度不同(或大或小或大或小).应用应用MINITABMINITAB分析分析(1)–(1)–老板的思考老板的思考是谁刷漆刷的这么厚是谁刷漆刷的这么厚?Bob? Jane? Walt?一定要查找出来一定要查找出来!!!(显著水平设为显著水平设为 5%)q 设置假设: 按照下列样式在按照下列样式在MinitabMinitab中输入数据中输入数据翻开翻开[ANOVA.MPJ]的的 ((3 Level ANOVA ))worksheetBobJaneWalt25.296926.005628.426826.057825.940027.508524.070026.006327.582524.819926.435627.401825.985125.992724.9209… …...应用MINITAB分析(2) – 输入数据1、判信、判信2、判量、判量参考参考章节章节参考参考< <抽样与样本大小抽样与样本大小> >章节章节: 应用应用MINITABMINITAB分析分析(3)–(3)–稳定性分析稳定性分析①①目的:确认各水平数据中是否有异常现象〔逃逸点、不随机等)目的:确认各水平数据中是否有异常现象〔逃逸点、不随机等). .②②途径:统计途径:统计-> -> 控制图〔参考下图)控制图〔参考下图)3 3、判异、判异 应用应用MINITABMINITAB分析分析(3)–(3)–稳定性分析稳定性分析③③输出结果输出结果④④结论结论 各水平中的数据没发现有异常点各水平中的数据没发现有异常点 可继续往后分析可继续往后分析 应用应用MINITABMINITAB分析分析(4)–(4)–正态性分析正态性分析①①目的:确认各水平数据是否服从正态分布目的:确认各水平数据是否服从正态分布. .②②途径:统计途径:统计-> -> 基本统计量基本统计量 -> -> 正态检验〔参考下图)正态检验〔参考下图)4 4、判形、判形 应用应用MINITABMINITAB分析分析(4)–(4)–正态性分析正态性分析③③输出结果输出结果④④结论结论 各水平中的数据都服从正态分布各水平中的数据都服从正态分布 可继续往后分析可继续往后分析 应用应用MINITABMINITAB分析分析(5)–(5)–等方差检验等方差检验①①目的:确认各水平数据之间方差是否相等目的:确认各水平数据之间方差是否相等.②②数据堆栈:途径:数据数据堆栈:途径:数据-> 堆叠堆叠 -> 堆叠列〔参考下图)堆叠列〔参考下图)5 5、判散、判散: 应用应用MINITABMINITAB分析分析(5)–(5)–等方差检验等方差检验③③等方差检验等方差检验 途径:途径: 统计统计-> 方差分析方差分析 -> 等方差检验等方差检验…(参考下图)(参考下图) P值值大于大于0.05④ ④ 输出结果输出结果⑤ ⑤ 结论:故结论:故3 3个人所油漆的厚度数据方差相等个人所油漆的厚度数据方差相等应用应用MINITABMINITAB分析分析(5)–(5)–等方差检验等方差检验 应用应用MINITABMINITAB分析分析(6) – (6) – 均值检验均值检验①①目的:确认各水平数据集所对应的总体均值是否相等目的:确认各水平数据集所对应的总体均值是否相等. .②②途径:(堆叠型〕统计途径:(堆叠型〕统计-> -> 方差分析方差分析 -> -> 单因子单因子……(参考左下图)(参考左下图) (非堆叠型〕统计(非堆叠型〕统计-> -> 方差分析方差分析 -> -> 单因子单因子… … (未堆叠存放)(未堆叠存放)6 6、判中、判中: 应用应用MINITABMINITAB分析分析(6) – (6) – 均值检验均值检验 应用应用MINITABMINITAB分析分析(6) – (6) – 均值检验均值检验③③均值检验输出结果均值检验输出结果④④均值检验结论均值检验结论 各水平数据集所对应的总体之间的均值至少有一个不相等各水平数据集所对应的总体之间的均值至少有一个不相等单因子方差分析因子方差分析: 厚度厚度 与与 作作业者者 来来源源 自由度自由度 SS MS F P作作业者者 2 80.386 40.193 44.76 0.000误差差 87 78.116 0.898合合计 89 158.502S = 0.9476 R-Sq = 50.72% R-Sq〔〔调整)整) = 49.58%32322212ssssPooled+ ++ += = P 值值小于小于显显著水平著水平 5% 时时, 得到得到至少有一至少有一个个总总体均体均值值与与其他其他总总体体均均值值不同的不同的结论结论. (推翻零假推翻零假设设)这时这时,推翻所有推翻所有总总体均体均值值相同的零相同的零假假设设(Ho ) - 即至少有一即至少有一个个均均值值不不同同.因因随随机机现现象得到象得到这样这样大的大的F-值值, 实实际际上其上其概概率不足率不足 1/10,000.这这与与抛硬抛硬币时币时, 10次次连续连续相同的相同的情情况况是相同的是相同的.群间方差与群内方差群间方差与群内方差相近时相近时, F值接近值接近1 .本例中本例中, F-值很大值很大.子群大小相同时共有标准差子群大小相同时共有标准差 应用应用MINITABMINITAB分析分析(7) – (7) – 残差分析残差分析 ① ①目的:二次检验前面的分析是否有不可信的证据〔残差有异常现象)目的:二次检验前面的分析是否有不可信的证据〔残差有异常现象) ② ②途径:途径: 统计统计->->方差分析方差分析 -> -> 单因子单因子……点击图形点击图形 -> ->点四合一点四合一7 7、判差、判差 应用应用MINITABMINITAB分析分析(7) – (7) – 残差分析残差分析 ③ ③残差输出结果:残差输出结果: ④ ④残差分析结论:没有足够的证据证明其残差分析有异常残差分析结论:没有足够的证据证明其残差分析有异常 主效果图、箱图及区间图应用应用MINITABMINITAB分析分析(8) – Plots(8) – Plots8、附图、附图 主效果图及 箱图应用应用MINITABMINITAB分析分析(8) – Plots(8) – Plots统计>方差分析方差分析>主效主效应图图形形>箱箱线图: Interval Plot (95% 置信置信区区间间)区间图区间图应用应用MINITABMINITAB分析分析(8) – Plots(8) – Plots: 应用MINITAB分析(9)–Ε SQUAREDqEpsilon-SquaredEpsilon-Squared虽虽然是一然是一个个有有争争议议的的统计统计量量, , 但其但其结结果提供果提供实实质质性的性的显显著性情著性情报报. . qEpsilon-Squared Epsilon-Squared 根据适根据适当当的的 input input变变量量说说明的明的 output output变变量的量的大小大小. .q该统计该统计量很容易量很容易计计算算. .q这值这值是是 Sum-of-Squares (Effect)/Sum-of-Squares (Total) . Sum-of-Squares (Effect)/Sum-of-Squares (Total) .q在采取措施以前在采取措施以前应经应经常要确常要确认这值认这值. .厚度的变动中有厚度的变动中有51% 51% 是由作业者的差异引起的是由作业者的差异引起的. .8、判重、判重: 应用MINITAB分析(10) – 结论q知道了是谁刷的厚知道了是谁刷的厚. .q单因子方差分析的单因子方差分析的 P-value < 0.05, P-value < 0.05,可采用备择假设可采用备择假设 (Ha) “ (Ha) “作作业者中至少有一名刷的厚度与其他不同业者中至少有一名刷的厚度与其他不同( (或大或小或大或小)”.)”.q这厚度差异这厚度差异, ,作业者实际影响的效果占作业者实际影响的效果占51%. 51%. q在在 95% 95% 的置信水平中的置信水平中 ( (显著水平为显著水平为 5%) 5%)确认为确认为WaltWalt有所不同有所不同. .q 决定对决定对WaltWalt进行再教育进行再教育. .q参考区间图或参考区间图或 主效应图主效应图9 9、判实、判实: q利用利用Mont52.mtw Mont52.mtw 分析焊接强度的数据分析焊接强度的数据. . q原因变量是电流原因变量是电流. .q按照分析按照分析 roadmap, roadmap,与旁边的人协作与旁边的人协作. .q您准备用不同的方法和结论对提问进行回答您准备用不同的方法和结论对提问进行回答. . 时间是时间是1515分分! !实习 – 解释: q按组别各准备按组别各准备 CATAPULT CATAPULT q发射者发射者(3(3名名) )的变化的变化? (? (跟球类无关跟球类无关) ) q角度每角度每 2 2 度变化时度变化时(4(4水平水平) ) 距离是距离是? (? (用乒乓球用乒乓球) ) q各条件用同样的条件各各条件用同样的条件各 15 15回回 Test Testq利用这利用这 DATA DATA利用利用 Minitab Minitab与前面路径一样实施与前面路径一样实施 ANOVA ANOVA 分析分析q结果发表结果发表 – – 实习实习 – CATAPULT – CATAPULT: Ft=2F值值和和 t值值的的关关系系对它进行测试对它进行测试 - 利用投射器利用投射器(catapult)数据数据, t-检验检验(两侧检验两侧检验)和和 F- 检验实施检验实施.再多想想再多想想(1) – t-test (1) – t-test 比较比较: q在前面关于油漆厚度的实验所得在前面关于油漆厚度的实验所得到的结果中到的结果中, , 针对针对BobBob的结果和的结果和 WaltWalt的结果进行比较的结果进行比较, , 将将t-testt-test得到的得到的 T T值进行平方时就得到与值进行平方时就得到与F F值相同的结果值相同的结果再多想想再多想想(1) – t-test (1) – t-test 比较比较: 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.