好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

基于本体论的语义导航模型研究.doc

6页
  • 卖家[上传人]:飞***
  • 文档编号:32340630
  • 上传时间:2018-02-10
  • 文档格式:DOC
  • 文档大小:72KB
  • / 6 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1基于本体论的语义导航模型研究 刘云 张玉峰 摘要:本文通过对信息导航的现状分析,提出基于本体论的语义导航思想,研究了基于本体论的信息组织,构建了基于本体论的语义导航模型,并结合实例探讨了语义导航的实现原理关键词: 语义导航 本体论 模型 Semantic Navigation Model Based on OntologyYun Liu Zhang YufengAbstract:The article firstly argues the concept and present situation of information navigation, then brings forward some ideas of the semantic navigation, information organization and valuable model based on Ontology, finally discusses the application of semantic navigation with an instance.Keyword:Semantic navigation Ontology Model1 信息导航的现状分析信息导航就是信息空间中的导航活动。

      信息空间并不局限在计算机数据范围内,而包括了人们的日常生活感受、对所有活动和事件的认识、历史时间积累的心理状态等十分广泛的社会信息内容,因而信息空间包含着比一般社会空间更为复杂的内容从信息学角度看,信息导航是以大家都可以理解的符号为基础的,而且有效的信息导航符号通常是在十分广泛的范围内共同约定形成的而且,几乎所有的符号都是人为确定的,不同文化背景 (民族、宗教、风俗、历史等)的人,根据自己群体的需要逐渐形成特殊的符号体系,去解释和代表不同的事物在网络信息全球化的今天,信息导航的符号则必须是在全球范围内约定的符号然而,即使有一个共同约定的广泛的符号体系,不同的人对于信息空间中概念的认识依然会存在差异,即信息空间中信息的语义理解是见人见智,是可以人为解释的这让信息导航变得十分艰难和低效基于本体论的语义导航应用规范化、概念化的符号和模型为信息导航提供了新的、有效的研究思路基于本体论的语义导航技术针对造成信息“迷航”的根本原因,解决信息空间的无序性带给信息导航的种种困扰它不仅在导航的符号中引入本体论的概念,还引入语义关联的思想本体论采用精确的形式语言、清晰的句法和明确的语义,使得问题域中的概念与概念、概念与对象、对象与对象之间的关系更加明确,大大减少了问题域中概念和逻辑关系产生误解的可能性。

      同时,本体论是从语义层次对应用领域的概念及概念关系进行规范化表达,将其作为知识共享的基础,从而提高知识的可重用性,避免了无谓的重复工作进而,通过概念化、领域知识共享和明确符号的语义理解,本体论让人与人、人和机器、机器和机器都可以进行简明的交流因此,在先进的信息技术和工具的支持下,用本体论的方法来获取、分析、组织信息导航中的各种信息无疑会更有效这就是本文研究的出发点,即应用本体论的思想,探讨基于本体论的信息组织和语义导航模型2 基于本体论的信息组织本体论作为元数据模式(metadata schemas),提供了一个可控的概念词典 1,其中每个概念都被清晰定义并具有准确的语义本体论通过基本的语义表示元素来表达本体及其关系,实现语义知识的组织本文系教育部人文社会科学研究博士点基金项目“基于信息构建的智能导航机理研究” (项目号:03JB870002)的成果1 Maedche A,Staab S , University of Karlsruhe. Ontology Learning for the Semantic Web. IEEE Intelligent Systems[J], 2001-03/04: 72-7922.1 本体论的概念本体论(Ontology)源自于哲学,是对客观世界的事物进行分解,发现其基本的组成部分,进而研究客观事物抽象本质的学科。

      西方早期称为 “实体论” ,是研究实体存在性和实体存在的本质等方面的通用理论在中国古代哲学中称作 “本根论” ,是探究天地万物产生、存在、发展变化的根本原因的学说20 世纪 90 年代,国际计算机界的研究表明,把现实世界中某个应用领域抽象或概括成一组概念及概念间的关系,即构造出这个领域的本体,对该领域信息的计算机处理十分有帮助于是近年来,本体论被越来越多的应用于计算机知识工程领域,提高知识重用和交互的质量及效率人们已经从不同的角度和方面为本体论的概念进行了定义,在知识工程界比较著名的有Gruber 的“本体论是概念化(conceptualization)的一个显式的规格说明”和 Borst 的“本体论是被共享的概念化的一个形式的规格说明” ,二者都特别强调了给出形式解释的可能性而Studer 等人则对这种可能性做出了进一步描述:“概念模型(Conceptualization) ”是指通过对某个客观现象的相关概念进行辨析和提取而获得的关于该现象的抽象模型;“显式(Explicit) ”是指对所使用的概念的类型,以及这些概念在应用上的约束都给予明确的说明;“形式化(Formal) ”表示本体应以规范化的高度概括的形式存在;“共享(Share) ”表示本体论中反映的是共同认可和接受的知识。

      目前,获得大部分研究者公认的本体论定义是 Tom Gruber 于 1994 年在 SRKB(Shared Reusable Knowledge Bases)的邮件列表中提出的定义:“本体论是关于共享概念的协议共享概念包括对领域知识建模的概念框架、可互操作的系统通信协议和特定领域理论的表示协议在知识共享环境中,本体以概念表达的形式进行描述 ”2.2 本体的语义表示元素在知识工程领域——或者更确切地说是在“概念化的显示表示”中,本体实际上是一种对事物 (或领域)的认识观本体的实体具体存在于自身和其关联的变化之间,通过对这种具体的存在进行概括产生抽象描述本体知识通过基本的语义表示元素来表达,这些语义表示元素也被称为元本体,主要包括:(1)概念——表示领域知识元,包括一般意义上的概念以及任务、功能、策略、行为、过程等,在本体的实现中,概念通常用类(Class)来定义,而且通常具有一定的分类层次关系2)属性——描述概念的性质,是一个概念区别于其他概念的特征,通常用槽(Slot)或者类的属性(Properties)来定义3)关系——表示概念之间的关联,例如典型的二元关联:父关系、子关系、兄弟关系等层次关系。

      通常用 R:C1*C2*………*Cn 表示概念类 C1,C2,………,Cn 之间存在 n 元关系 R4)函数——表示一类特殊的关系,即由前 n-1 个要素来唯一决定第 n 个要素,通常用F:C1*C2*………*Cn-1—>Cn 表示函数5)公理——表示永真式,在本体中,对于属性、关系和函数都具有一定的关联和约束,这些约束就是公理6)实例——表示属于某个概念类的具体实体或特定领域的所有实例构成领域概念类在该领域中的称域从信息组织角度看,本体由一组用于描述现实情况的特定术语集和一组用于描述领域术语的内涵且显式的公理集组成术语集对术语可以有其词汇表及词汇意义的说明,并定义概念,最后形成统一的符号体系;公理集则可以描述术语所表示概念间的关系,表达明确的语义,二者结合就可以很好地描述各种事物及事件如果多个系统间采用相同的术语集和公理集来对某个共同领域进行描述,那么系统之间就可以跨跃对于概念语义理解的差异,实现系统间无阻滞的通信、重用、交互操作和共享描述这些术语、实体并反映其间关系主要是通过上述概念、属性、关系、3函数、公理、实例等语义表示元素进行的,所以本体在本质上就是一种语义知识表达方式2.3 基于本体论的语义知识组织语义知识主要包括信息对象的语义内容、信息对象间的语义关系及相关的操作方法。

      语义内容主要以语义概念的形式表示人们对事物共同特点的认识,同时通过概念关联来体现信息内容的语义关系,因此语义知识的表示可以看成是对概念及其概念关联进行描述语义知识的组织,通常先建立参照本体,然后通过参照本体对无序异构的 WWW 信息资源进行组织参照本体是通过分析术语集和公理集,提取公共概念、属性和关系而构建的语义统一本体,它为所有信息资源提供统一的概念集合和通用语义表达语义知识的本体主要有以下类型:(1)领域本体它用于描述特定专业领域的本体,定义该领域的概念和概念间关系,描述该领域的基本原理、主要实体和主要活动及其关系,提供领域内部知识共享和知识重用的公共理解基础领域本体的主题内容、描述方式和详略程度由信息导航的应用环境、涉及的专业领域以及用户导航需求等因素决定目前许多领域已经拥有了相应的本体,例如美国国家医学图书馆建立的 UMLS 医学领域本体、多伦多大学的虚拟企业(virtual enterprise)企业本体,酶催化生物医学本体 GENSIM, Plinius 陶瓷材料本体等 (2)通用或常识本体它用于描述通用或人们使用最频繁的知识,如:时间、空间、事件等目前世界上已实现的最大常识通用本体是 CYC 公司的 OpenCyc 本体,最新版的 OpenCyc 包括 10 万个概念类和 6 万个关于这些概念的声明(包括概念间的关系、对概念的限制等) ,100 万条公理。

      另外, OpenCyc 还包括一个基于本体的常识推理机3)方法本体它也被称为任务本体,用于描述任务的求解方法,如医学诊断方法、信息导航策略等方法本体和一般的本体不同,它主要描述的是动态知识,其目的在于提供可共享的问题求解方法,即研究与领域无关的解决问题的方法方法本体中经常描述的要素包括:任务目标和相关体系、任务方法和推理机制、任务数据、执行状态等Chandrasekaran 等人关于任务和问题求解方法本体研究的 Chandrasekaran et al(1997)是目前任务本体的代表4)元数据本体它是用于描述信息资源元数据的本体元数据用来定义信息资源的格式和内容,元数据本体则提供了这些定义方法的公共理解基础元数据本体主要包括语言学本体和知识表示本体语言学本体是指关于语言、词汇等的本体,主要侧重于静态的不具连续性的知识表达的语言,目的在于提高语言自身的表达能力;知识表示本体主要是研究知识的本质特征和基本属性,重点在于提供一个形式化机制,为信息交流提供一个知识共享的桥梁,目的在于提高人们对知识的理解能力利用上述六种语义表示元素,首先建立参照本体,然后对 web 信息进行组织,形成基于本体论的语义资源知识库和公共语义模型。

      通常,仅是资源知识库并不能完全直接利用Web页面的底层语义,所以还必须采用语义知识组织模型基于特定主题对知识库内容进行聚合,以提供语义推理等功能常见的语义知识组织模型有语义分类结构、概念图、语义网络、语义索引等3 基于本体论的语义导航模型通过建立参照本体以及进行信息整合,无序异构的网络信息数据通过语义概念和语义关系被组织到一起,形成一个有序的公共语义知识模型但是对于具体网络用户的信息导航,并不全部直接在公共语义模型上进行,而是依据用户语义模型有针对性地进行同时,它通过语义表示要素支持语义知识的表示和推理,从而规范公共语义模型和用户语义模型的构建,使同一概念在用户的语义模型和资源的公共语义知识模型中的描述保持一致3.1 模型框架基于本体论的语义导航是一种以结构化、语义化的概念知识组织为基础,通过语义机制来实现导航的方法与技术它分为两个方面:一是基于本体论的信息组织,即利用参照本体对多种信息源进行语义描述和整合,形成一个有序的公共语义知识模型;二是基于本体论的语义导航结构模型的4构建,即在有序信息组织的基础上,构造用户语义模型,并据此建立导航结构图 1 显示了基于本体。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.