
基于多元统计分析的生产过程故障诊断研究1.doc
7页基于多元统计分析的生产过程故障诊断研究一、主元分析简介传统的多元统计过程监测与控制方法(MultivariateSPM&C)非常适合用来分析二维稳态过程的数据矩阵,包括变量之间的线性关系但由于在实际应用中外部条件并不都是理想的,因此需对基本多元统计方法作出改进,纵观近年来的研究文献,主要有以下一些方法:1.多向主元分析(MPCA):MPCA可以用来分析从间歇生产或者半间歇生产过程中获得的多维数据矩阵通过一定的线性转换将多维数据矩阵切割成多个二维子数据模块,然后按照新的排列顺序,转化为二维数据矩阵,再应用基本PCA方法进行诊断分析2.多重或多数据块PCA(Hierachiealormulti一bloekPCA):可以将大的原始数据矩阵分解成多个子数据矩阵或者数据块,使得建模过程数据信息的分析更加简便3.动态PcA(DynamicPCA):能够实时监视由于时滞变量的影响而不断增大的数据矩阵,实现抽取与时间关联的关系信息,以实现过程同步监测以及设计实时控制器4.非线性PCA(NonlinearPCA):是从PCA基本方法中延伸出来的,非线性现象几乎存在于一切实际生产过程中,利用非线性PCA可以抽取过程变量间的非线性关系。
5.PLS是基于推论模型(类似于二级变量模型(Secondary Vriable Model)或者软测量传感器(SoftSensor))的用于质量控制的一种方法,主要是针对那些过程中有许多最终产品质量参数以及与生产率有关的变量,而这些变量一般都具有严重的时滞现象,并且难以直接测量获得6.自适应PCA能够通过指数滤波持续的更新模型参数(Wbld,1994),以达到自动调整诊断模型,实现故障诊断的准确性和实时性在近年来的文献中,有关基于多元统计分析的过程监测与控制方法成功应用的案例有广泛的记载在现实的生产过程,如冶金、橡胶、制药以及石化工业中,多元统计分析主要的应用领域包括数据表现(模型)、数据压缩和信息抽取、正常过程的行为监控、非正常过程的监测及辨识(如故障诊断)以及推论控制等二、主元分析的数学原理主元分析(PCA)是由Pearson(1901)最早提出来的,Fisher和Maehenzie(1923)认为,主元分析在系统相应方差分析方面的用途比在系统建模方面的用途要大Hotelling(1933)对主元分析方法进行了改进,使其成为了目前被广泛应用的方法主元分析(PCA)是一种较为成熟的多元统计监测方法。
在化工生产中能够获取观测值的显式变量数量众多,且相互间又存在复杂的相关性,应用PCA的方法将显式变量作一定的线性转化产生数量较少的隐式变量,降低原始数据空间的维数,再从新的隐式变量中提取主要变化信息及特征这样既保留了原有数据信息的特征,又消除变量间的关联、简化分析复杂度,从新的数据空间中提取符合相应要求的主元数,同时也消除了部分的系统噪声干扰主元分析的对象是样本点x变量类型的数据表其目标是在力保数据信息丢失最少的情况下,对高维变量空间进行降维处理假设数据矩阵x(m、n),m代表测量采样次数,n代表测量变量个数,主元分析方法的数据压缩过程实质上是数据矩阵X协方差矩阵的谱分解过程主元分析的对象是样本点x变量类型的数据表其目标是在力保数据信息丢失最少的情况下,对高维变量空间进行降维处理假设数据矩阵x(m、n),m代表测量采样次数,n代表测量变量个数,主元分析方法的数据压缩过程实质上是数据矩阵X协方差矩阵的谱分解过程其中是X的协方差矩阵;是协方差矩阵的特征向量;是按降序排列的特征值主元空间的信息抽取实质上是选择几个有代表性的主元,解释数据中大部分变化,数学表达式如下: (3)其中是系统主元,也称得分向量,提取采样数据间关联信息;是主元特征向量,也称载荷向量,提取变量间关联信息;E是残差矩阵,提取随机噪声和模型误差信息。
各个得分向量之间是正交的,即对任何i和j,当ij时满足=0各个负荷向量之间也是互相正交的,同时每个负荷向量的长度都是1,即 ij i=j将式(3)两边同时右乘,可得到下式:向量的长度反映了数据矩阵X在方向上的覆盖程度它的长度越大,x在方向覆盖程度或者变化范围也就越大若得分向量按其长度做一下排列:那么负荷向量代表X变化的最大方向,与垂直并代表X变化的第二大方向,用将代表X变化最小的方向当矩阵X中的变量间存在一定程度的线性相关时,X的变化主要体现在最前面的几个负荷向量方向上,X的最后几个投影比较小的负荷向量,可以写成残差矩阵E,主要由噪声引起,往往可以忽略,起到减少噪声影响的效果,不会引起数据中有用信息的明显损失因而数据X可以近似地表示为:主元分析的过程实质是对原坐标系进行平移和旋转变换,使得新坐标的原点与数据群点的重心重合新坐标系的第一轴与数据变异的最大方向对应,新坐标轴的第二轴与第一轴标准正交,并且与数据变异的第二大方向对应……依此类推这些新的主轴分别就是若经过舍弃少量信息后,主轴能够十分有效地表示原始数据的变异情况,则原来的m维空间就被降至k维可以用原样本群点在新空间的投影来近似地表达原群点。
在信息抽取过程中,合理确定主元的个数非常重要,主元选取多则模型相对精确,但增加了分析与诊断的复杂性,无法有效清除噪声;主元选取过少,则不能充分提取原始数据空间的信息,使分析与诊断的误差率增加在实际检验中,可采用交叉检验法来确定最优主元个数,一部分用来建立主元回归模型,另一部分用来检验所建立的主元回归模型通过保留不同数据的主元,建立若干主元回归模型,然后在检验数据上测试这些模型,并从中选取在检验数据中测试误差最小的那个主元回归模型或者也可用主元贡献率累积和百分比(CPV)的方法,先计算各主元贡献率,选择累积和百分比大于某个百分数的主元个数三、主元数据处理的方法3.1过程统计控制图控制图最初是有曾在美国贝尔实验室任检验部负责人的美国著名质量管理专家休哈特(WA.Shewhart)于1924年利用费歇(Fisher)建立的统计推断学创立的,是统计过程控制中最基本最典型的方法应用单变量控制图可以监视生产运行参数和质量指标的变化其后,各国均颁布了相应的相关标准随着全面质量管理引入我国,控制图在我国也得到了推广,并且颁布了GB4091、GB4887等控制图系列标准(王海燕等,2001)我国国家标准GB4O91.1中规定,“控制图是生产过程质量的一种记录图形,图上有中心线和上下控制界限,并有按时间顺序抽取的个样本统计量的数值。
在几十年的发展过程中,控制图技术不断有所创新,1954年E.S,Page和Kemp发明了累积和控制图(CumulativeSumControlChart,简称CUSUM图),1959年5.W.Roberts提出指数加权滑动平均控制图(ExponentiallyWeightedMovingAverageControlChart,简称EWMA图),1980一1981年我国学者张公绪和阎育苏发明了选控图(SeleetionControlChart)和通用控制图(GeneralControlChart)除此还有各种特殊控制图,如1969年美国F.S.Hiilier与新加坡杨中浩提出的小样本x一R控制图,1987年Jaehn提出的区域控制图(ZoneControlchart),1996年c.P.Quesenberry提出的Q控制图,19%年陈志强提出的基于模糊信息的多种模糊控制图,时序控制图(TimeSeriesControlChart)等其中比较常用的控制图有传统的Shewhart控制图、适用于检测工序小偏移的CUSUM控制图和面向先进制造技术(AdvancedManufactureTechnology,简称AMT)的EWMA控制图。
按控制图的用途来分,控制图可分为分析用控制图和管理(或控制)用控制图,分析用控制图主要是用来调查生产过程(工序)是否处于控制状态,并能对工序能力作出估计它是进行工序控制或进行工序能力调查的第一阶段,是管理用控制图的基础管理用控制图主要是用来控制工序,使之经常保持在统计控制状态之下按控制对象是计量值还是计数值来分,控制图可分为计量值控制图和计数值控制图计量值Schewhart控制图包括平均值和极差控制图(x一R图)、中位元数和极差控制图(x一R图)、平均值和标准差控制图(x一R图)、单值和移动极差控制图(x一R图)等;计数值Shewhart控制图包括不合格品率控制图(p图)、不合格品数控制图(图)、缺陷数控制图(c图)、单位缺陷数控制图(u图)等CUSUM图又分为两种形式,即V形模板CUSUM图和带有固定界限的CUSUM图3.2多变量统计过程控制图多变量统计过程控制通过同时考虑所有的数据并提取过程变化的“方向”信息来克服单变量统计过程控制的不足,其相应的诊断技术取得了一些进展(司马锡生,2000)在实施多变量统计过程控制时,首先要建立一个反映正常运行的主元模型,主元分析统计过程监测模型描述了正常工况下各过程变量间的由物料平衡、能量平衡以及操作限制等约束所造成的关联。
具体建模方法就是将过程数据向量投影到两个正交的子空间(主元空间和残差空间)上,并分别建立相应的统计量进行假设检验,判断过程的运行状况假设是生产工况下的运行数据,在进行主元分析时,首先要将数据进行标准化,即将每个变量的均值减掉然后除以它的标准差 (3.1)其中为变量X的均值, 为变量的标准差对进行主元分析可得 (3.2)若可以用前k(k SPE统计量也被称为Q统计量对第i个采样点来说 (3.5)其中是式(10)中E的第i行, ,I是单位矩阵SPE统计量代表数据中未被主元模型所解释的变化当SPE过大时,说明过程中出现了异常的情况当检验水平为时,控制限可按下式计算: (3.6)其中: (3.7) (3.8)为X协方差矩阵的特征值,是正态分布置信度为的统计,若Q<,说明该时刻SPE统计正常,由于统计量SPE是由多个变量的综合作用而成,因而SPE可对多个变量工况同时进行监控3.4主元得分图主元得分图反映的是主元模型内部主元向量的空间分布它既可以是单个主元的控制图,也可以是多个主元所构成的平面、立体的轨迹图,还可以与SPE值构成平面、立体的SPE一score图,与图相比较,主元图更为详细而形象地反映了主元模型内部各个主元随时间波动的情形。 主元得分向量可按下列公式计算: 。
