
灰色关联度教学文案.pptx
51页灰色系统与灰色系统与 灰色关灰色关联度分析联度分析目目 录录灰色系统的基本概念灰色关联度分析灰色系统的提出灰色系统的提出 灰色系统理论(Grey System Theory)的创立源于20世纪80年代邓聚龙教授在1981年上海中-美控制系统学术会议上所作的“含未知数系统的控制问题”的学术报告中首次使用了“ 灰色系统”一词灰色系统的基本概念灰色系统的基本概念灰色系统是指部分信息已知而部分信息未知的系统,灰色系统理论所要考察和研究的是信息不完备的系统,通过已知信息来研究和预测未知领域从而达到了解整个系统的目的灰色系统理论与概率论、模糊数学一起并称为研究不确定性系统的三种常用方法,具有能够利用“少数据” 建模寻求现实规律的良好特性,克服了数据不足或系统周期短的矛盾灰色理论应用领域数据生成 关联分析 预测模式 评估决策 系统控制灰色相对于白色和黑色系统的影响因素不完全明确因素关系不完全清楚系统结构不完全知道系统的作用原理不完全知道黑色系统黑色系统是指一个系统的内部信息对外界来说是一无所知的,只能通过它与外界的联系来加以观测研究白色系统白色系统是指一个系统的内部特征是完全已知的,即系统的信息是完全充分的。
灰色系统理论的应用灰色系统理论的应用目前,灰色系统理论得到了极为广泛的应用,不仅成功地应用于工程控制、经济管理、社会系统、生态系统等领域,而且在复杂多变的农业系统,如在水利、气象、生物防治、农机决策、农业规划、农业经济等方面也取得了可喜的成就灰色系统理论在管理学、决策学、战略学、预测学、未来学、生命科学等领域展示了极为广泛的应用前景 基本概念:灰数基本概念:灰数灰数(grey number)没有明确数值或确定的分布,仅知大概范围(上限 下限)当灰数的上限和下限相等时,就成为了确定数基本概念:灰度基本概念:灰度灰度(grey degree)基本概念:白化基本概念:白化白化(whitening)由于灰数是一个范围而非确定的数如果需要解决的问题本身要求是一个明确的数,此时就需要将灰数转化为一个确定的数,称为白化称为白化系数基本概念:累加生成基本概念:累加生成累加生成(Accumulated Generating Operation,AGO)生成技术将原始数据予以累加,所形成的数列一般为单调递增的平稳和有规律的数列累加的规则将原始序列的第一个数据作为生成列的第一个数据,将原始序列的第二个数据加到原始序列的第一个数据上,其和作为生成列的第二个数据,将原始序列的第三个数据加到生成列的第二个数据上,其和作为生成列的第三个数据,按此规则进行下去,便可得到生成列。
记原始时间序列为:生成列为:灰色关联度分析灰色关联度分析基本概念灰色关联分析因素间关系的复杂性因素间关系的复杂性客观世界中存在着的大大小小的各类系统,都是由许多因素组成的这些系统及系统因素之间,相互关系非常复杂特别是表面现象变化的随机性容易混淆人们的直觉,掩盖事物的本质,使人们在认识、分析、预测和决策时得不到充分全面的资讯,不容易形成明确的概念系统之间的关系与因素系统之间的关系与因素因此,不仅不同系统之间的关系是灰的,同一系统中不同因素之间的关系也是灰的人们一时分不清哪些因素关系密切,哪些因素关系不密切,也就是说难以找到主要矛盾,抓住主要特征与主要关系关联度分析关联度分析为此,灰色系统理论提出了关联度分析的概念,其目的就是通过一定的方法沥青系统中各因素间的主要关系,找出影响最大的因素,把握矛盾的主要方面如各类产业中哪个项目的收入对产值的影响最明显,这种影响程度表明有关生产和销售系统之间或系统内部各因素之间的关联性关联度的意义关联度的意义对两个系统或两个因素之间关联性大小的度量,称为关联度它描述系统发展过程中因素间相对变化的情况,也就是变化大小、方向及速度等指标的相对性如果两者在系统发展过程中相对变化基本一致,则认为两者关联度大;反之,两者关联度就小。
对系统的认识对系统的认识可见,灰色关联度分析是对于一个系统发展变化态势的定量描述和比较只有弄清楚系统或因素间的这种关联关系,才能对系统有比较透彻的认识,分清哪些是主导因素,哪些是潜在因素,哪些是优势而哪些又是劣势 所以,对一个灰色系统进行分析研究时,首先要解决如何从随机的时间序列中找到关联性,计算关联度,以便为因素判别、优势分析和预测精度检验等提供依据,为系统决策打好基础因此说,灰色因素间的关联度分析,实质上是灰色系统分析、预测、决策的基础比较比较一般的抽象系统都包含有许多影响因素,多种因素共同作用的结果决定了系统的发展态势我们希望从众多的因素中判断出:哪些是主要因素、哪些是次要因素这些都是系统分析的内容,数理统计中的回归分析、方差分析、主成分分析、相关分析等都可以用来进行此类系统分析这些方法的不足之处是:1、要求有大量的数据 2、要求样本服从某一种典型概率分布,各因素数据与系统特征数据之间呈线性关系且各因素之间彼此无关3、计算量大4、可能出现量化结果与定性分析结果不符的情况灰色关联分析的基本特征灰色关联分析的基本特征建立的模型属于非函数形式的序列模型计算方便易行对样本数量多寡没有严格要求不要求序列数据必须符合正态分布不会产生与定性分析大相径庭的结论关联度的概念关联度的概念对于两个系统或系统中两个因素之间,随时间或不同对象而变化的关联性大小的程度,称为关联度。
在系统发展过程中,若两个因素的变化具有一致性,则两个的关联程度就高反之,则低灰色关联分析方法是根据因素之间发展趋势的相似或相异程度,做为衡量两个因素关联程度的一种方法灰关联分析的步骤灰关联分析的步骤1)确定参考序列和比较序列;2)作原始数据变换;3)求绝对差序列;4)计算关联系数;5)计算关联度;6)排关联序;7)列关联矩阵进行优势分析第一步:确定参考序列第一步:确定参考序列灰色关联度可分成“局部性灰色关联度”与“整体性灰色关联度”两类主要的差别在于局部性灰色关联度有一参考序列,而整体性灰色关联度是任一序列均可为参考序列第二步:原始数据变换第二步:原始数据变换由于系统中各因素的量纲不一定相同,如劳动力为人,产值为万元,产量为吨等,且有时数值的数量级相差悬殊,如人均收入为几百元,粮食每公顷产量为几千公斤,费用为几十万元,有些产业产值达百亿元,有些产业才几万元,等等,这样的数据很难直接进行比较,也不同且它们的几何曲线比例也不同因此,对原始数据需要消除量纲,转换为可以比较的数据序列数据转换的基础知识数据转换的基础知识序列:映射:序列到序列的数据变换序列 到序列 的数据变换:数据变幻的方法:初值化变换数据变幻的方法:初值化变换分别用同一序列的第一个数据去除后面的各个原始数据,得到新的倍数数列,即为初值化变换数列。
各值均大于0,且数列有共同的起点数据变换的方法:均值化变换数据变换的方法:均值化变换先分别求出各个序列的平均值,再用平均值去除对应序列中的各个原始数据,所得到的新的数据序列,即为均值化序列数据变换的方法:百分比变换数据变换的方法:百分比变换数据变换的方法:倍数变换数据变换的方法:倍数变换数据变换的方法:归一化变换数据变换的方法:归一化变换数据变换的方法:极差最大化变数据变换的方法:极差最大化变换换数据变换的方法:区间值化变换数据变换的方法:区间值化变换先分别求出各个序列的最大值和最小值,然后将各个原始数据减去最小值后再除以最大值与最小值之差数据变换的性质数据变换的性质上述变换满足1) ;2)保序性:3)保差异性:对任意的 ,有 多指标序列的数据变换多指标序列的数据变换设有多指标序列称映射 为序列 到序列 的数据变换多指标序列的数据变换多指标序列的数据变换多因素指标的数据变换主要依赖于指标的属性类型,常用的属性类型有效益型(指标值越大越好型)成本型(指标值越小越好型)固定型(指标值越接近某固定值越好型)区间型(指标值越接近某固定区间越好)偏离型(指标值越偏离某固定值越好)偏离区间型(指标值越偏离某固定区间越好)等 常用的多指标序列的数据变换(常用的多指标序列的数据变换(1 1)1)效益型: 2)成本型: 常用的多指标序列的数据变换(常用的多指标序列的数据变换(2 2)3)固定型: 为固定值 4)区间 型: 常用的多指标序列的数据变换(常用的多指标序列的数据变换(3 3)5)偏离 型:6)偏离区间 型: 第四步:计算关联系数第四步:计算关联系数定义 为灰关联系数其中, 为绝对差, 为两极最小差, 为两极最大差, 为分辨系数,其意义是削弱最大绝对茶树至太大引起的失真,提高关联系数之间的差异显著性,(0, 1),一般情況下可取0.10.5。
第五步:计算关联度第五步:计算关联度定义3:设为 指标 的权重,满足 , ,定义 为 对 的灰关联度, 是序列几何距离的一种度量实例实例 用灰关联分析的方法分析影响呼和浩特市大气污染的各主要因素的污染水平表1 1999-2003年城市大气污染监测数据因素 1999 20002001 20022003 大气污染值 0.732 0.646 0.636 0.598 0.627 NO0.038 0.031 0.0420.036 0.043 TSP 0.5070.451 0.448 0.4110.1220.0480.034 0.030 0.0300.031 工业总产值 183.25 207.28 240.98 290.80 370.00基建投资 24.03 44.98 62.7983.44 127.22 机动车数量85508 74313 85966 100554 109804 煤炭用量 175.87 175.72 183.69 277.11 521.26 沙尘天数 10 13 13 11计算步骤计算步骤(1)将城市区域大气污染值作为参考序列 ,其他各因素作为比较因素序列 ,对各因素初值化处理,得各标准化序列表2 标准化数据因素 1999 20002001 20022003 大气污染值 10.883 0.869 0.817 0.857 NO10.816 1.105 0.9471.132 TSP 10.890 0.884 0.811 0.241 10.708 0.625 0.625 0.646 工业总产值 11.131 1.315 1.5872.019 基建投资 11.872 2.613 3.4725.294 机动车数量10.869 1.005 1.176 1.284 煤炭用量 10.999 1.044 1.576 2.964 沙尘天数 11.300 1.300 0.1000.100(2 2)由上表求绝对差,得序列)由上表求绝对差,得序列 (3 3)计算关联系数如下:取)计算关联系数如下:取 (4 4)计算关联度)计算关联度取 ,比较因素和参考因素的关联度为 结果分析结果分析从结果可以看出,直接因素(前3个)关联度的排序为 ,说明在城市大气环境的影响因素中,TSP是主要因素;在间接因素(后5个)中,关联度的排序为 ,机动车数量是主要的间接影响因素。












