
非正态数据转换及过程能力分析V0.ppt
33页Nonnormal Data,非正态数据转换,及过程能力分析,关于这个模块,使用为正态分布数据设计的工具主要依赖于数据确实接近正态分布且稳定(没有异常原因) 这个模块主要研究对非参数数据起作用的方法我们将学到…,1. 为什么我们需要正态数据2. 如何检验正态数据 – 所有的数据 – 分层的数据3. 我们如何对连续数据实施转换使其正态 – 转换的类型 – 转换选择 – Box-Cox 方法4. 非正态数据的流程能力分析,非正态数据,不是所有的数据都是正态,,只在一个 方向有长尾的我们就说他是偏斜的,,使用非正态数据的结果,案例:计算正态曲线的流程西格玛值为了判定流程西格玛,找到超出规格界限的缺陷区域:[在Z表中查找不合格率]如果数据是非正态的,那么估计的缺陷区域将会不正确, 使用这种方法将会得到错误的流程西格玛值受非正态数据影响的方法,,注意!,有些时候异常原因导致正态数据出现偏斜,寻找使数据偏斜的因子始终绘制数据的时间序列图 – 寻找流程平均数或可变性的偏移 – 可能导致偏斜始终根据其他因子对数据分层 – 某个特殊组可能导致偏斜,案例:决定时间,目标:使用Minitab 检查数据组的正态性。
背景:一个商业贷款业务根据作出决定的时间收集数据可以得到100笔贷款申请的数据时间假定是按天记录18天是允许决定的最长时间1. 绘制决定时间的直方图2. 构建决定时间的正态图3. 决定时间是正态分布的吗?4. 检查时间图和分层的点图,判定是否:– 有偏移发生在特殊的时间,– 另一个因子导致偏斜直方图,直方图,正态性检验,Stat>Basic Stat>Normality Test,,其他正态检验方法?,正态检验,,检查分层数据,,Graph>Dot Plot,Minitab 输出,,两种因子分层都没有明显的证据,时间序列图,,Graph > Time Series Plot,结论既不是因子(决定或区域) 也不是时间移动了数据因此,假设决定时间是非正态的是可靠的看数据是否符合一个已知的分布,Stat>Quality Tools>Individual Distribution Identification,分布识别图,绘制流程能力图,Stat>Quality Tools>Process Capability>Process Capability Analysis Nonnormal,能力分析,什么是转换?,“线性” 转换线性转换有以下形式: Y = aX + b; 你能:数据乘以一个常数u 给数据增加一个常数u 或两者都做线性转换的例子u 乘以或增加一个常数会影响数据的形状(分布) ;它将只是改变刻度。
u 改变指数或使用三角函数会影响数据的形状形状改变转换,BOX-COX,结果分析,检验转换后是否正态,检验结果,正态检验,使用Lambda,Box-Cox 转换,Box-Cox 幂转换把Y 升高到l1的幂,幂转换包括以下方面:,能力分析,能力分析,能力分析,该你了…,数据收集了银行的排队时间,上界限是3.5分钟数据在“Bank Queue”栏中检验正态性选择最佳转换(如果需要)执行流程能力分析如果数据非正态判定最佳分布使用最适合分布执行流程能力分析比较结果谢谢!,谢谢您的参与,下次课再见!,。
