好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

粗集理论的实验系统.pdf

9页
  • 卖家[上传人]:橙**
  • 文档编号:333325900
  • 上传时间:2022-09-02
  • 文档格式:PDF
  • 文档大小:244.57KB
  • / 9 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 176 第十一章Rough 集理论的实验系统为了便于Rough 集理论学习者和研究人员的参考,本章将对国际上已经研制出来的一些Rough 集工具软件进行介绍,如 Rough Enough、Rose、Rosetta、KDD-R、LERS 等,其他的一些系统,如 Rough Set Library、Grobian、Datalogics、K-Days、Rough Analysis 等,这里限于篇幅就不具体介绍了,有兴趣的读者可以到Electronic Bulletin of the Rough Set Community 的站点(http:/www.cs.uregina.ca/roughset)和相关的网络站点去查询11.1Rough Enough Rough Enough 是由挪威Troll Data Inc.在 4GL DBMS Paradox for Windows 下开发的一个基于Rough 集理论的数据挖掘工具系统,目前已经发展到4.0 版,可以在 http:/www.trolldata.no/renough下载该软件数据挖掘的流程图如图11.1-1 所示输出编辑数据初始输入到预处生成约简生成预测和获取预处理Rough 理不分规则分析Enough 明矩阵集合近似图 11.1-1 数据挖掘的流程图下面按这个流程图对Rough Enough 系统进行介绍。

      Rough Enough 系统不包括最前面的数据获取和初始预处理两个步骤名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 9 页 -177 输入到 Rough Enough 中,支持多数PC 数据库和电子数据表格式,RSES(Rough Set Expert System)和 Rough Set Library 2.0 版的格式也支持只需转换数据库驱动程序就可以方便地访问SQL 服务器预处理阶段可以选择如下的方法:绝对改变:按照样本的编号计算当前样本和前一个样本之间的差值百分比改变:以百分比变化的方式计算当前样本和前一个样本之间的差值划分表格:根据用户对于保留样本量的选择,将表格划分为两个,划分掉的样本另外存储,用做测试规则的样本TIS 和 IS:将一个时序信息系统转换成为一个信息系统除此之外,用户还可以直接访问SQL 和 QBE,这能够让用户实现一些特殊的功能编辑阶段中,用户可以在电子表格中编辑数据生成可辨识矩阵阶段,根据信息系统计算得到可辨识矩阵集合近似阶段,系统有很多工具:等价类、决策类、下近似、上近似、边界域、Rough 成员值和一般化决策规则这些计算是依赖于用户所选择的属性的。

      约简阶段,用遗传算法生成约简结果生成规则、预测和分析阶段:得到决策规则并对测试样本集进行测试这个阶段,根据分析测试的结果,也许还需要返回前面的阶段进行循环,以得到满意的结果11.2 ROSE ROSE(Rough Set Data Explorer)系统是由波兰Poznan 工业大学计算科学研究所智能决策支持系统实验室开发的一个模块化软件系统,它实现了Rough 集理论的基本理论和规则获取技术这个系统实现了 Pawlak 的基本 Rough 集模型和 Ziarko 的可变精度Rough 集模型ROSE 系统是 RoughDAS&RoughClass 系统的新版ROSE 是由几个独立模块集成而成的首先,在高级的计算机(如UNIX 工作站)上建立计算引警,这有利于对大数据集进行快速分析;然后,在Windows 平台上开发友好的用户界面这些模块可以独立进行重新设计和开发,然后重新编译其中严重依赖于平台的部件是图名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 9 页 -178 形用户界面(GUI)所有这些都保证了系统易于适应将来的操作系统和平台ROSE 是 运 行 在PC 兼 容 机32 位 图 形 用 户 界 面 操 作 系 统Windows95/NT4.0 上的交互式软件系统。

      其核心模块用标准ANSI C+程序设计语言编制,接口界面模块用Borland C+(带对象窗口库)和Borland Delphi 编制系统包括一个图形用户界面和一系列单独的计算模块这些模块是与平台独立的,可以被包括UNIX机在内的不同目标机重新编译图形用户界面覆盖了所有的计算模块因此,系统具有很好的可扩充能力ROSE 的操作简单,鼠标操作,菜单驱动,用户界面友好,专家和普通用户均可以用它来进行数据分析系统通过对话窗和用户交互,所有的结果按环境表示,数据可以用电子数据表编辑ROSE 接受信息表数据输入属性分为条件属性和决策属性数据按照一定的文件格式(Information System File,ISF)存储在一个纯文本文件中ROSE 还可以接受RoughDAS 的数据,并按照几种其他格式输出,如LERS 和 C4.5 的格式ISF 文件格式允许最多30 个字符的长属性名和字符串、实数、整数值由于它是纯文本文件,因而可以不作任何变化在不同操作系统之间传递,也易于编辑数据和校验文件中数据的正确性ISF 文件有开放的文件格式,被分为节,可以按照将来应用的需要增加尚未定义的新节用户仅通过改变属性的限制就可以决定忽略掉一些属性。

      除了可视化图形用户界面,所有的结果也写入纯文本文件,即使在 ROSE 系统外也可以读取这些文件,而且易于转换为其他文件格式现在,ROSE 的计算模块具有如下特征:数据校验和预处理;采 用Fayyad&Irani离 散 化 算 法 和 用 户 自 己 离 散 化(user-driven discretization)对连续值属性进行自动离散化处理;用标准 Rough 集模型或可变精度Rough 集模型对条件属性近似目标分类的能力进行定性估计;用多种算法(S.Romanski 和 A.Skowron 等人的算法)发现属性核以及信息表的约简(所有约简,或者一组预定规模大小的约简);通过观察分类质量的变化,考察一个给定属性对于目标分类名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 9 页 -179 的相对重要性;为目标分类选择最重要的属性,删去冗余属性(实现了几种能够保证目标分类质量的属性子集选择技术);用 LEM2 算法或 Explore 算法获取决策规则;获取规则的后处理(剪除规则、根据用户的要求选择感兴趣的规则);基于不同的规则匹配技术,用决策规则对新目标进行分类;用 K 叠交叉验证方法对决策规则集进行评价。

      还可以很容易地增加新的模块到这个系统之中ROSE 系统实现的功能还是有限的,有待于进一步扩充,其开放的系统结构也为此奠定了基础ROSE 系统已经成功地应用于处理很多实际数据集,如医学、药剂学、技术诊断、金融和管理科学、图象与信号处理、地质、软件工程评估等11.3 Rosetta Rosetta 是由挪威科技大学计算机与信息科学系和波兰华沙大学数学研究所合作开发的一个基于Rough 集理论框架的表格逻辑数据分析工具包,包括了计算核和图形用户界面,能够在微机的Windows NT/98/95 操作系统上运行Rosetta 的设计实现了对数据挖掘和知识获取的支持从数据的初始浏览和预处理,计算最小属性约简和产生if-then决策规则或描述模式,到对所得到的规则或模式的验证和分析Rosetta的目的是要作为基于不可分辨关系模型的通用工具,不是为某个特定的应用领域而设计的专用系统Rosetta 提供了一个很直观的图形用户接口,采用了数据导航的技术,图 11.3-1 给出了 Rosetta 的界面结构示意图图形用户界面是高度面向对象的,所有的操作对象被表示为独立的图形用户界面的元素项,每个元素项有自己的与上下文相关的菜单集合。

      Rosetta 的计算核心也可以采用命令行程序计算核心提供了如下的功能:输入/输出通过 ODBC 和 DBMSs 部分集成输出格式包括规则、约简、表格、图象以及C+和 Prolog等格式预处理名师资料总结-精品资料欢迎下载-名师精心整理-第 4 页,共 9 页 -180 不完备数据表的完备化处理(数据补齐)名师资料总结-精品资料欢迎下载-名师精心整理-第 5 页,共 9 页 -181 图 11.3-1 Rosetta 系统的界面结构名师资料总结-精品资料欢迎下载-名师精心整理-第 6 页,共 9 页 -182 连续属性值的离散化计算支持有教师学习和无教师学习支持用户自己定义的不可分辨关系概念对不同类型的不可分辨关系有效地计算精确约简和近似约简产生 if-then 规则或以约简形式表达的描述模式执行文件支持交叉验证测试后处理过滤约简结果和所得到的规则验证与分析用得到的规则处理未知样本产生混淆矩阵、ROC 曲线和标度曲线用一定的质量标准对规则进行评价统计假设测试其它公差关系聚类计算划分和可变精度Rough 集近似支持对观察的随机抽样Rosetta 在上述的功能中提供了很多可选的算法,是一个很好的研究 实 验 平 台。

      一 个 非 商 用 的Rosetta系 统 版 本 可 以 在HTTP:/WWW.IDT.UNIT.NO/ALEKS/ROSETTA/ROSETTA.HTML下载得到11.4 KDD-R KDD-R是由加拿大Regina 大学研制开发的基于可变精度Rough集模型(VPRS,variable precision rough set)的数据库知识获取KDD系统该系统是在UNIX 系统下用C 语言实现的,它具有X-Windows的菜单驱动界面KDD-R 系统曾成功应用于医学数据分析和电信市场的决策分析等该系统由四大部分组成:1.数据预处理单元;2.属性依赖分析和消除冗余属性单元;名师资料总结-精品资料欢迎下载-名师精心整理-第 7 页,共 9 页 -183 3.规则提取单元;4.决策单元数据预处理单元把原始信息表中的数据进行离散化处理首先,KDD-R 对于每个感兴趣的决策属性值v 构造一个辅助表Tv,在表中条件属性不变,而把决策属性划分为属于v 和不属于v 两部分这样,就把 m 个决策属性值的原问题分解成m 个子问题,每个都只有一个决策属性值其次,对每个子表的条件属性值进行离散化KDD-R 允许用户自己定义合适的区间范围来离散化数据值(手工离散化),也可以由系统自动进行离散化处理。

      系统通过查找质量准则Q(rA)最大的值范围,把每个实值属性替换为相应值范围上的一个或多个三值离散属性属性依赖分析和消除冗余属性单元是基于VPRS 模型的同原始Rough 集模型相比,VPRS 在计算集合Y 的下界、边界区和负区域时有一定的灵活性具体而言,给定上限参数和下限参数(01),集合 Y 的-下近似定义为R(Y)=E|(ER*)c(E,Y),其中,R*是等价关系族,而c(E,Y)=1-Card(EY)/Card(E)称为分类因子相应地可定义边界区域和负区域用户需要提供相应的参数和,并表明分析是集中在-下界还是-上界所谓-上界是-下界和边界区域的并集接着,KDD-R 使用 Rough 集相应的公式来计算条件属性和决策属性之间的依赖性、相对约简和核规则提取单元计算所有或部分带有决策概率(可信度)的近似规则,其中概率由上限参数和下限参数来决定可以使用决策矩阵方法来进行约简和计算规则,也可以计算最大近似规则,即根据支持每条规则的数据集合的包含关系所定义的偏序中的最大元素计算这类规则在可用数据的支持意义上是最有力的,并且是相互独立的用户也可以选择生成所有规则或指定规则的最小覆盖决策单元是对决策规则的控制单元。

      许多系统所采用的简单的决策方法是找到并使用前件满足条件的规则这些方法忽略了从数据中获取的规则具有不确定和相关的决策概率与之相反,KDD-R 使用最大条数的规则,把尽量多的规则组合在一起,并对输入计算每个决策类的决策分为避免受每个决策类中规则数不同的影响,KDD-R 将决策分进行了。

      点击阅读更多内容
      相关文档
      初中英语新人教版八年级上册Unit 4 Amazing Plants and Animals默写练习(汉译英+英译汉+音标写英汉)(附参考答案)(2025秋).doc 高中英语2026届高考完形填空常考形容词和副词(共107个).doc 初中英语新人教版八年级上册Unit1—Unit3单元写作指导(写作任务+思路点拨+参考范文】.doc 初中英语2026届中考单词词性和固定搭配解析(名词+动词+形容词+副词+介词+连词).doc 小学科学新教科版三年级上册全册思维导图(共三个单元)(2025秋).doc 初中英语新人教版八年级上册Unit 2 Home Sweet Home单词转化和练习.doc 初中英语2026届中考语法基础知识汇总(共七部分).doc 初中英语新人教版八年级上册Unit 6 Plan for yourself默写练习(汉译英+英译汉+音标写英汉)(附参考答案)(2025秋).doc 初中英语新人教版八年级上册Unit3—Unit4重点短语(2025秋).doc 初中英语2026届中考人教版新课标高频短语汇总(动词短语+介词短语+固定搭配与习语).doc 初中英语新译林版八年级上册Unit 1 Friendship课文解析(A部分)(2025秋).doc 小学英语新人教版PEP四年级上册unit5—unit6知识点(2025秋).doc 初中英语新外研版八年级上册 Unit 1 This is me.语法知识现在完成时讲解与练习.doc 初中英语新译林版八年级上册Unit 1 Friendship课文解析(B部分)(2025秋).doc 初中英语新人教版八年级上册Unit 1 Happy Holiday单词转化和练习.doc 初中英语2026届中考作文对话描写高分句分类汇总(科学现象+人际交往+立秋).doc 初中英语2026届中考主要时态句型(含例句)(共十类100个).doc 初中英语2026届中考基础词汇(共28类400个).doc 初中英语2026届中考作文高分素材(常用句式+活用句型+名言谚语+关系连词).doc 初中英语新译林版八年级上册Unit 1 Friendship语法和写作(2025秋).doc
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.