好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

语义网SemanticsWeb.ppt

170页
  • 卖家[上传人]:壹****1
  • 文档编号:578917347
  • 上传时间:2024-08-25
  • 文档格式:PPT
  • 文档大小:1.22MB
  • / 170 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 语义网(Semantics Web)语义网概述RDF本体语义网描述语言 语义网概述什么是语义网 语义网体系结构 当前语义网的主要研究内容 什么是语义网语义网不是一个独立的网络,而是当前的这个网络的扩展在语义网中信息被赋予了明确界定的意义、从而能更好地使计算机和人协调工作把语义网纳入现有网络结构中的首批步骤已经在着手进行之中在不远的将来.计算机处理并“理解”那些现今它们只能显示的数据的能力将会大大提高,这样语义网建设的进展就将有助于创造出引人注目的全新功能 [Tim Berners-Lee(Web和语义网的创始人), 语义网——科学美国人,2001] 要点◦是当前Web的延伸; ◦加入计算机可以理解的语义 什么是语义网起源:目前Web的缺陷HTML仅仅用以表示数据显示的布局,HTML所表达的页面信息和组织方式,主要面向用户直接阅读,没有将信息的表现形式、内在结构和表达内容相分离,没有提供计算机可读的语义信息,因而非常不利于计算机直接阅读和处理 什么是语义网契机:90年代中期,XML的出现,将数据的内容与布局区分开来,为语义更丰富、更自然的网上内容表达打开了新的局面。

      语义网的目标是:为Web上的信息提供具有计算机可以理解的语义,从而满足智能代理(Agent)对Web上异构、分布信息的有效检索和访问,实现网上信息资源在语义层上的全方位互联,并在此基础上,实现更高层的基于知识的智能应用 语义网概述什么是语义网 语义网体系结构 当前语义网的主要研究内容 语义网体系结构在学术界,Tim Berners-Lee提出的语义网层次结构如图所示该结构从底层到高层依次为Unicode(统一字符编码)和URI(Universal Resource Indicator,统一资源定位符)、XML、RDF和RDF Schema(简称RDFS)、本体(Ontology)、逻辑(Logic)、验证(Proof)和诚信(Trust)在语义网七层结构中的XML、RDF和Ontology三层,主要用于表示Web的语义,因而是系统的核心和关键所在此外,数字签名用来检测文档是否被篡改过,以证实其真实可靠性 与语义网有关的标准和技术可扩展置标语言可扩展置标语言名域名域国际码国际码统一资源标识统一资源标识可扩展置标语言结构可扩展置标语言结构资源描述框架资源描述框架 资源描述框架结构资源描述框架结构 实用分类系统词表实用分类系统词表逻辑逻辑验证验证诚信诚信数数字字化化签签名名能自描述能自描述的文献的文献数据数据数据数据规则规则 语义网体系结构Unicode和URI层 Unicode和URI是整个语义Web的基础,其中Unicode处理资源的编码,保证使用的是国际通用字符集,实现网上信息的统一编码。

      URI是URL(Universal Resource Locator)的超集,URI支持语义网上的对象和资源的精细标识,从而使精确信息检索成为可能 语义网体系结构XML+Name Space+XML Schema层 XML层具有命名空间(Name Space)和XML Schema(XML模式)定义,通过XML标记语言将网上资源信息的结构、内容与数据的表现形式进行分离,确保语义网的定义,并支持与其他基于XML的标准进行无缝集成 语义网体系结构RDF+RDF Schema层 该层用于描述万维网上的资源及其类型,为网上资源描述提供了一种通用框架和实现数据集成的元数据解决方案最底层的URI标识网上的对象,RDF和RDFS层则可对URI标识的对象进行陈述(Statement) 语义网体系结构本体层 该层用于描述各种资源之间的联系,本体揭示了资源本身以及资源之间更为复杂和丰富的语义信息,从而,将信息的结构和内容相分离,对信息作完全形式化的描述,使网上信息具有计算机可理解的语义因为本体定义了不同概念间的关系,所以本体层能够对字典(或词汇,Vocabularies)的变迁提供支持。

      语义网体系结构逻辑层 逻辑主要提供公理和推理规则,为智能推理提供基础该层用来产生规则验证(Proof) 证明注重于提供认证机制,证明层执行逻辑层产生的规则,并结合信任层的应用机制来评判是否能够信赖给定的证明 语义网体系结构诚信(Trust) 顶层的诚信注重于提供信任机制,以保证用户代理Agent在网上进行个性化服务和彼此间交互合作时,更安全与可靠 当前语义网的主要研究内容 XML            XML允许用户加入任意结构到他们的文档但没有指明这种结构的意义是什么 RDF ◦把意义编码在“三元组”集合中:实体有可以赋值的属性◦实体、属性和值都有截然不同的URI 当前语义网的主要研究内容本体(ontology) ◦数据库A和数据库B可以用不同的字段来容纳‘邮政编码’ ◦本体拣选输出 ◦Ontology = ‘一个文档或文件,它形式化定义术语之间的关系’ 代理(Agent) “基于计算的代理出现是作为一个适当的范例,它工作在一个复杂的世界里,用多个本体、片段和多个推理引擎 语义网(Semantics Web)语义网概述RDF本体( Ontology )语义网描述语言 资源描述框架(RDF)RDF基础 RDF/XMLRDF Schema RDF基础什么是RDFRDF的基本思想 什么是RDFRDF(Resource Description Framework),资源描述框架资源描述框架(RDF)是由W3C开发的一个资源描述规范。

      其最初的目标就是解决不同元数据的互操作问题资 源 描 述 框 架 (Resource Description Framework, 简称 RDF)是一个用于表达关于Web资源的元数据,比如Web页面的标题、作者和修改时间,Web文档的版权和许可信息,某个被共享资源的可用计划表等 在“Web资源(Web resource)”这一概念一般化后,RDF可用于表达关于任何可在Web上被标识标识的事物的信息,即使有时它们不能被直接从Web上获取比如关于一个购物机构的某项产品的信息(例如关于规格、价格和可用性信息),或者是关于一个Web用户在信息递送方面的偏好的描述 RDF不仅用于显示信息,更重要的是用于信息的处理,RDF提供了一种用于表达信息、并使其能在应用程序间交换而不丧失语义的通用框架既然是通用框架,应用程序设计者可以利用现成的通用RDF解析器(RDF parser)以及通用的处理工具能够在不同的应用程序间交换信息意味着对于那些并非信息的最初创建者的应用程序也是可利用这些信息 RDF并不直接定义自己的元数据语词,相反,它提供一个框架,在这一个框架内,可以利用其它元数据的元素对资源的语义进行描述。

      换句话说,RDF本身并不对各种不同的元数据进行语义定义,而是提供一种框架体系,使不同的人能够在这一框架下定义他们自己的元数据的元素 RDF使用了XML语言,RDF在XML基础之上,以一种标准的、能够相互操作的方式揭示数据的深层语义RDF和XML是相互补充的RDF主要关注于元数据模型的建立,而有关编码方式、字符集等等方面的问题,RDF依赖于XML还应当了解到,基于XML的RDF仅仅只是RDF的一种应用模式,除XML语法之外,RDF还允许有其它的语法模式 目前来看,RDF已成为元数据处理的基础,它提供应用程序间的互操作能力,可以在Web上实现机器能够“理解”的信息交换RDF强调对Web资源的自动化处理机制,可以应用于许多领域:如应用于资源发现领域,以提高搜索引擎的性能;应用于编目领域,可以对Web站点、页面、数字图书馆的内容进行揭示,并对各种相关关系进行描述;应用于智能软件代理之中,促进知识的共享和交换;应用于内容评价,可以保护儿童或使自己的私有权利不被侵犯;应用于知识的组织,使这些页面能够成为合乎逻辑的一篇文章;描述Web页面的知识产权;表述用户或网站的隐私保护权利。

      W3C甚至认为RDF和数字签名是创建“诚信Web”的关键技术,它将被应用于电子商务、网际合作等相关领域 RDF基础什么是RDFRDF的基本思想RDF的三元模型 RDF的基本思想RDF基于这样的思想:◦用Web标识符(称作统一资源标识符,Uniform Resource Identifiers或URI)来标识事物◦用简单的属性(property)及属性值来描述资源◦这使得RDF用资源标识-属性类型-属性值这样的表示模型来定义一个或多个关于资源◦这种模型就是RDF的三元模型 RDF的三元模型RDF可以将一个或多个关于资源的简单陈述表示为一个由结点和弧组成的图(图(graphgraph)),其中的结点和弧代表资源标识、属性类型或属性值对于某一资源的描述,我们可以用自然语言进行描述例如“资源http://www.example.org/index.html 的创建者是John Smith”这一句话可以用资源标识-属性类型-属性值三元组的方式进行表示如下:资源标识,也就是句子描述的对象是http://www.example.org/index.html属性类型,也就是资源的属性是Creator  属性值,也就是资源属性的值是John Smith 资源-属性类型-属性值关系图 http://www.example.org/index.htmlJohn SmithCreator这是一个由两个节点和一条弧线构成的图,其中一个节点是资源,另一个节点是属性值,弧线从资源指向属性值,表明资源具有某一属性类型的属性值。

      从另一个角度来看,语句“资源http://www.example.org/index.html 的创建者是John Smith”这一句话可以由主语、谓语、宾语构成其中:◦主语是URL http://www.example.org/index.html ◦谓语是词"creator" ◦宾语是"John Smith“在RDF中,◦用于识别事物的那部分就叫做主语 ◦用于区分语句对象主语的各个不同属性(譬如:作者,创建日期,语种等等)的那部分叫做谓语 ◦用于区分各个属性的值的那部分叫做宾语 尽管这种主语、谓语、宾语关系和自然语言语法中的主语、谓语、宾语关系还不完全一样,但这足以构成RDF存在的逻辑基础:◦语句可以对资源进行描述;◦语句由主语、谓语、宾语组成;◦语句中的主语、谓语、宾语可以被一个可被标识的资源,此资源的属性描述(如名称、创建时间、出版者等)和资源的属性值所替代◦ RDF基于资源标识-属性类型-属性值的三元模型提供了对资源进行描述的框架 RDF的三元模型可以对资源进行描述,但为了使其能够被计算机处理,还需要考虑:◦一整套计算机可以处理的标识,这些标识能够对所描述的资源、属性类型和属性值进行标识,并且使这些资源标识、属性类型和属性值具有一个明确有指示意义,没有二意性,这个标识符系统不会和其他人可能在Web上使用的相似的标识符系统混淆◦一种计算机可以处理的语言,以描述这一模型,并且可以在应用系统之间交换这些信息。

      第一个问题(一整套计算机可以处理的标识)◦RDF使用了URI和命名空间作为其标识机制(用于标识陈述中的主体、谓词和客体)的基础◦更准确地说,RDF使用的是URI参照( URI引用)(URI references)◦一个URI参照(或“URIref”)是一个在尾部附加了可选的“片段识别符(fragment identifier)”的URI比如,URI参照(URIref) http://www.example.org/index.html# section2由URI http://www.example.org/index.html 和(由符号#分隔的)的section2 (片段标识符)组成 第二个问题(一种计算机可以处理的语言)◦为了用一种机器可处理的(machine-processable)方式来表示RDF陈述(RDF statements),RDF采用了XML◦XML允许任何人来设计他们自己的文档格式,并可用这种格式书写文档◦RDF定义了一个特殊的XML标记语言(称为RDF/XML)来表示RDF信息和在机器间交换这些信息 ( URI参照)例如上例子中的资源、属性类型和属性值,可以用下面的URI参照表示如下:◦资源 http://www.example.org/index.html ◦属性类型http://purl.org/dc/elements/1.1/creator ◦属性值 http://www.example.org/staffid/85740 如果利用了URI参照,则上面的图也应当改为: http://www.example.org/index.htmlhttp://purl.org/dc/elements/1.1/creatorhttp://www.example.org/staffid/85740 在前一个图中,利用了方形来表示属性值“John Smith”,而在后一个图中,则利用椭圆来表示属性值“http://www.example.org/staffid/8574”。

      二者不同之处在于John Smith是常量值(在RDF中,被称为文字值,literal),而http://www.example.org/staffid/8574是一个URI参照在RDF中,属性值可以是URI参照或常量值 在RDF中,利用URI参照的好处是能够非常明确地表示语句的主题,例如使用了http://www.example.org/staffid/85740,而不是John Smith,它能够明确地表明,此页面的创建者不是字符串“John Smith”,也不是成千上万个名为“John Smith”的人,而是一个与特定URI参照相关的John Smith另一方面,由于这是一个指向特定John Smith的URI参照,因此,它其实也是一个完全具备其它资源所具有的属性的资源,我们可以增加信息,以进一步描述这个John Smith(这个资源)所做的工作仅只需将指向John Smith的URI参照作为一个需要描述的对象即可,如下图中,我们增加了对John的名字和年龄的说明 http://www.example.org/index.htmlhttp://purl.org/dc/elements/1.1/creatorhttp://www.example.org/staffid/85740John Smith27http://www.example.org/terms/namehttp://www.example.org/terms/age (RDF/XML)为了使RDF便于计算机处理,RDF利用了XML语言作为支持。

      实际上RDF是XML语言的一个特殊应用,它遵守XML的语法规则,这种基于XML语法的RDF被称为RDF/XML正如前面我们所说的,RDF本身不定义元数据元素(语词体系),在RDF/XML中,为了唯一地引用某一元数据(如DC、P3P或PICS)的元素,RDF充分借助了XML名字空间名字空间的应用,使得我们可以用更加简洁的方式描述RDF中资源、属性类型和属性值的唯一性 使用了名字空间的XML元素被称为XML修饰名(XML Qualified name,Qname)Qname由一个指向名字空间URI的前缀,紧接一个冒号(:),再接一个名字空间中的本地名称组成 完全的URI参照可以用Qname进行表示例如上例中的属性类型◦http://purl.org/dc/elements/1.1/creator在这种情况下,可以将DC作为一个前缀指定给名字空间为◦Xml:DC= http://purl.org/dc/elements/1.1/则DC:creator就能够代表指向http://purl.org/dc/elements/1.1/creator的URI参照 下面是几个比较著名的名字空间◦前缀rdf:,名字空间URI: http://www.w3.org/1999/02/22-rdf-syntax-ns#◦前缀rdfs:,名字空间URI: http://www.w3.org/2000/01/rdf-schema#◦前缀dc:,名字空间URI: http://purl.org/dc/elements/1.1/◦前缀owl:,名字空间URI: http://www.w3.org/2002/07/owl#◦前缀xsd:,名字空间URI: http://www.w3.org/2001/XMLSchema# 针对上例,我们再定义两个名字空间前缀:◦前缀 ex:, 名字空间URI: http://www.example.org/ ◦前缀 exstaff:, 名字空间 URI: http://www.example.org/staffid/则上面的URI参照例子就可以简写为:◦资源 ex:index.html ◦属性类型dc:creator ◦属性值 exstaff:85740 在上图中,利用了两个文字值来表示资源的姓名和年龄。

      其中“John Smith”和“27”是两种不同类型John Smith”是字符类型,而“27”是数值类型为了更确切地表示文字值的类型,RDF引入了类型文字值(typed literal)的概念RDF类型文字值由字符串和URI参照组成,其中的URI参照唯一标识了一个特定的数据类型例如上图中的“27”,可以表示如下:◦"27"^^http://www.w3.org/2001/XMLSchema#integer 如果采用了Qname的方式,可表示为:◦"27"^^xsd:integer 至此可以看到,RDF本质上很简单,它是由节点和弧线组成的图,通过URI参照,能够被解释成为对某个事物的某些特性的说明另外,在这一模式中,需要提供一种方法来唯一地描述资源、属性类型、属性值以及属性值的类型URI参照的应用,提供了这种描述的唯一性在实际应用中,通过Qname来替代URI参照 资源描述框架(RDF)RDF基础 RDF/XMLRDF Schema RDF/XML如上所述, RDF的概念模型是节点和弧线组成的图RDF提供了一个XML语法以实现RDF模型的记录和交换,被称为RDF/XML。

      RDF/XML是书写RDF的规范语法在本节中,将对RDF/XML语法进行说明 我们还以“资源http://www.example.org/index.html 的创建者是John Smith”这一个句子为例对于这一个句子,可以利用RDF表示如下: John Smith 这是一个XML文件对于这个例子,需要注意三点: (1)    根元素RDF◦这个根元素以及其它所有的RDF元素通常都放在http://www.w3.org/1999/02/22-rdf-syntax-ns# 名字空间中 , 这个名字空间要么利用前缀rdf引用,要么被设置成为缺省名字空间。

      如果使用显示前缀的方式,则空的RDF元素如下所示: ◦如果使用缺省名字空间,则表示如下 (2)描述元素Description◦谈及RDF的statement时,显而易见, statement是一种“description(描述)”并且,它是一种“about(有关)”语句主体的描述RDF/XML采用了 rdf:about 属性来指定主体资源的URIref◦在RDF/XML中,Description元素的出现表示对资源描述的开始,被描述的资源由Description元素的“about”进行唯一标识。

      而资源的其它属性元素被嵌套在Descrition元素之内,表示这些属性是“about”所指示资源的属性 John Smith在上面的片段中,表示http://www.example.org/index.html 所指示资源的创建者是John Smith (3)名字空间◦RDF本身不定义自已的元数据语词,它通过URI参照利用其它元数据的语词来对资源属性进行说明◦在RDF/XML中,利用名字空间来实现URI参照如例子中的creator元素,就是引用了DC元数据元素,它在根元素中,通过xmlns:dc=”http://purl.org/dc/elements/1.1/” 语句指明 以下是更多的实例 对资源多个属性的描述◦下面的例子,增加了另一个名字空间,对资源的多个属性进行了描述 August 16,1999 English 注意,在dc:creator元素中,使用了空元素,在这个空元素中,使用了rdf:resource属性,指出属性元素的值是另一个由URI参照指定的资源。

      文字值类型的使用 1999-08-16 在上面的例子中,使用了文字值类型,在exterms:creation-date属性元素中,增加了一个rdf:datatype属性,这一属性的值是一个指向一个日期类型的URI参照 多资源描述 August 16, 1999 en 容器的使用◦当RDF元素使用同类型的多个属性来描述一个资源时,容器就可以将这些属性组织起来。

      ◦例如描述一门课程有多个学生上课时,各个属性具有相同的属性类型,但各自的属性值各不相同在RDF中,利用容器,可以整体上描述这一组同属性的元素,同时还可对各属性值之间的关系进行揭示 ◦RDF定义了三种类型的容器:rdf:Bag,rdf:Seq,rdf:Alt其中Bag容器中的属性没有先后顺序Seq容器中的属性需要按顺序排列Alt容器中的属性只能任选其一◦下面的例子,描述 “课程Course 6.001的学生有Amy, Mohamed, Johann, Maria和Phuong”这样一个句子 其中用到容器。

      元素被嵌入在 属性元素之内,对于 元素内的各个子元素,以rdf:li元素进行进行描述元素rdf:li取自于HTML中的list item之意 容器与容器的用法相似,不同之处在于中的各个子元素是以一定的顺序出现的 下例是一个使用了容器rdf:Alt的例子 它表示“X11的源代码可以被在ftp.example.org, ftp1.example.org,或在ftp2.example.org”上找到。

      资源描述框架(RDF)RDF基础 RDF/XMLRDF Schema RDF SchemaRDF Schema概述类及其描述描述属性 RDF Schema概述通过已经命名的属性类型和属性值,RDF提供了一种简单的方式对资源进行说明但是,在某些情况下,用户希望能够根据需要自定义一些词汇,然后用这些词汇来描述资源这些词汇表明用户正在描述某种资源,并且会采用某些特定的特性来描述RDF本身并不能针对特定应用需求来定义一些类和特性这些类和特性被称为RDF词汇,它们需要通过RDF词汇描述语言:RDF Schema(RDF的一种扩展语言) 来定义 例如某个经营帐篷的公司,需要对帐篷的型号、重量、包装、大小进行描述的时候,需要定义一个类来描述帐篷,定义一些属性来描述帐篷的型号、重量、包装大小等RDF本身并不能够定义这种针对特定应用的类和属性,但是这种类和属性可以被当成是RDF的语词进行描述,当然这需要对RDF进行扩展,而这种扩展是由RDF语词描述语言——RDF Schema提供的 RDF Schema是RDF的语义扩充RDF Schema本身也不是具体去指定一个针对应用的语词体系,如上面所的帐篷、型号、重量、包装大小等,实际上,它提供一种机制去描述这些类和属性,并指明这些类和属性之间的种种关系,例如什么哪些类具有哪些属性,哪些属性需要一起应用等等。

      另一方面,RDF Schema为RDF提供了一个类型系统RDF Schema的类型系统可能与面向对象语言中的程序设计语言相似,例如RDF Schema认为资源是一个或多个类的实例另外,RDF Schema也可以以一种层次化的结构来组织类例如ex:Dog(狗)类可以作为ex:Mammal(哺乳动物)的子类但是,RDF类和属性在某些地方与程序设计中的类和属性有很大的差异我们将在后面看到 RDF Schema 所具有的这些能力本身也是以 RDF词汇形式提供的也就是说,这些RDF 词汇是一组带有特殊含义的、预定义的RDF资源这些资源的(RDF Schema词汇)URI带有前缀 http://www.w3.org/2000/01/rdf-schema# (QName通常采用前缀 rdfs:) 采用RDF Schema 语言所定义的词汇描述(schemas)也是合法的RDF图因此,即使一个软件不是专为处理新加的RDF Schema词汇而开发的,它仍然可以将schema解释为一个包含了各种资源和特性的合法RDF图但是这个软件并不能“理解”新添加的RDF Schema术语的内在含义为了理解新加术语的含义,RDF 软件必须能够处理一种扩展语言。

      这种扩展语言不仅仅包含rdf:前缀的词汇,而且还包含了rdfs:前缀的词汇,以及这些词汇的内在含义 类及其描述最基本的描述过程是标识需要描述的事物,通常是从划分被描述事物的种类开始的RDF将这些事物的种类称之为类◦RDF Schema中的类相当于某类事物的总体概念,如同Java程序中的类一样RDF类可以代表几乎所有事物,如Web页面、人、文件类型、数据库或其它抽象概念类的描述使用RDF Schema中的:◦资源(rdfs:Class和rdfs:Resource),和◦属性(rdf:type和rdfs:subClassOf) ◦在RDF Schema中,首先要确定类,属于某一类的具体资源是这个类的实例◦在RDF Schema中,一个类是任何具有rdf:type属性、并且该属性的值为rdfs:Class的资源◦如描述一个交通工具的类,并为这个类指定一个URI参照为ex:MotorVehicle,则需要指出这个类的rdf:type属性为rdfs:Class如:ex:MotorVehicle rdf:type rdfs:Class◦rdf:type用于指示资源是类的一个实例因此,在定义了一个类ex:MotorVehicle之后,资源exthings:companyCar可以通过RDF语句被描述作一种交通工具。

      exthings:companyCar rdf:type ex:MotorVehicle ◦在RDF Schema中,rdfs:Class本身也是资源,而且也有一个rdf:type属性并且该属性的值为rdfs:Class一个资源可以是一个或多个类的实例 ◦我们还可以对更特殊的交通工具进行描述,如可以将卡车、货车的资源作为一个类进行描述 ex:Van rdf:type rdfs:Class ex:Truck rdf:type rdfs:Class ◦类与类之间的特化关系(specialization relationship)可以用预定义的属性rdfs:subClassOf来描述例如,可以通过编写下面这条RDF声明来描述ex:Van是一种特殊的ex:MotorVehicleex:Van rdfs:subClassOf ex:MotorVehicle◦如果资源ex:MiniVan是ex:Van的一个实例, 如:ex:MiniVanrdf:typeex:Van◦则可以推断ex:MiniVan同样是ex:MotorVehicle的一个实例 下面是以RDF/XML书写的交通工具Schema]> 描述属性除了描述特定的类之外,用户团体还需要能够描述特定的事物的某些属性(如MiniVan的座位数)。

      在RDF Schema中,利用RDF类rdf:Property以及RDF Schema的rdfs:domain, rdfs:range和rdfs:subPropertyOf,可以对属性进行描述在RDF中,所有的属性都是类rdf:Property的实例对于新的属性,可以通过指定其rdf:type为rdf:Property URI参照进行声明如exterms:weightInKg rdf:type rdf:Property 除了rdf:Property 之外,RDF Schema还提供了语词以描述在RDF数据中如何对类下的属性进行声明其中最重要的是利用RDF Schema的rdfs:range和rdfs:domain属性,来进一步描述应用程序专用的属性 rdfs:range属性用来指定某一属性值是某个类的一个实例例如,当需要指定属性ex:author的值是ex:Person的实例时,需要按以下的RDF进行声明ex:Person rdf:type rdfs:Class ex:author rdf:type rdf:Propertyex:author rdfs:range ex:Person◦一个属性可以有多个range,如下所示:ex:hasMother rdfs:range ex:Female ex:hasMother rdfs:range ex:Person 对于上面的ex:hasMother属性,如果指定了下面的语句◦exstaff:frank ex:hasMother exstaff:frances ◦则表示exstaff:frances同时是ex:Female 和ex:Person的实例。

      rdfs:range属性还可以用于指示属性值是一个类型文字值例如,如果指定ex:age是一个属性,并且其值为XML Schema的数据类型xsd:integer,则可以用以下RDF语句声明ex:age rdf:type rdf:Propertyex:age rdfs:range xsd:integer ◦其中XML Schema中的xsd:integer数据类型,还可以用RDF Schema的类rdfs:Datatype进行显性的说明如下所示:xsd:integer rdf:type rdfs:Datatype . rdfs:domain属性用于指定特定的属性适用于某个特定的类例如如果需要指出属性ex:author适用于类为ex:Book的实例,则可利用以下RDF语句进行说明:ex:Book rdf:type rdfs:Class ex:author rdf:type rdf:Propertyex:author rdfs:domain ex:Book ◦这些语句说明ex:Book是一个类,ex:author是属性,并且属性ex:author是ex:Book实例的一个属性。

      ◦一个属性也可以有多个domain,如下例表明exterms:weight属性可以适用于 ex:Book 和 ex:MotorVehicle类exterms:weight rdfs:domain ex:Bookexterms:weight rdfs:domain ex:MotorVehicle 在此,可以利用range和domain来为MotorVehicle增加新的属性:ex:registeredTo和 ex: seatNumber,◦ex:registeredTo 属性适用于任何ex:MotorVehicle并且其值为ex:Person ◦ex: seatNumber适用于ex:PassengerVehicle,它的值是一个xsd:integer,表明座位数◦其RDF语句片段如下所示:      RDF Schema通过rdfs:subPropertyOf属性,可以指定两个属性之间的关系。

      例如 ex:primaryDriver 和 ex:driver都是属性,并且属性ex:primaryDriver是属性 ex:driver的一个特例,可以用RDF声明如下:ex:driver rdf:type rdf:Property. ex:primaryDriver rdf:type rdf:Property ex:primaryDriver rdfs:subPropertyOf ex:driver 下面是交通工具Schema的完整声明]>                 以上说明了如何利用RDF Schema描述类和属性。

      如何利用这个Schema来描述资源?下面是一个描述ex:PassengerVehicle实例的例子: ]>  5 语义网(Semantics Web)语义网概述RDF本体(Ontology)语义网描述语言 本体(Ontology)Ontology的概念Ontology的作用Ontology的类型Ontology的组成开发Ontology的方法构建ontology的工具当前研究存在的问题 Ontology的概念Ontology  本来是,哲学中研究 ‘being’的性质及其内在关系的理论;ontology 是一种元理论,它的理论让人们在认识上,能够区别开那些本来是不同的beings,区别开beings之间关系的差异。

      Ontology  is the theory of objects and their ties . An ontology is a specification of a conceptualizationAn Ontology 是在一定知识范围内,对所谈论的一组概念,对它们给出一种语义约定 我们所说的Ontology来自人工智能的研究,被用于促进知识的共享和重用自20世纪九十年代以来,Ontology成为了一个被知识工程、自然语言处理、智能信息系统、知识管理等多个研究领域共同关注的一个重要概念Ontology是对某一领域可共享的、通用的理解,其目标是使知识能够在人与人之间、人和系统之间、以及各种异构系统之间进行广泛的交流创建Ontology的目标就是提供一种机器可以处理的信息资源语义描述机制,使得知识语义能够在不同的智能代理(软件和人)之间传递和交流在一个知识系统中,问题解决方法描述推理行为,而Ontology描述静态的领域知识 近十几年来,关于Ontology的定义有多个最能描述Ontology本质的是斯坦福大学的Gruber在1993年的定义:◦Ontology是一个对共享概念的形式化的、显性的规定。

      ◦“概念”指的是对现实现象的抽象◦“显性的”意味着对概念的类型、以及对概念的应用是显性定义的◦“形式化的”意味着Ontology应当是机器可读的◦“共享”意味着一个Ontology揭示着广泛共享的知识,也就是说,一个Ontology不仅仅被几个个体接受,而需要被一个群体所接受的本质上讲,Ontology在知识工程中的角色在于促进一个领域模型的建设一个Ontology提供了某个领域模型内语词和相互关系的描述 其它定义◦ Neches et al.(1991)指出:“一个本体定义了组成主题领域的词汇的基本术语和关系,以及用于组合术语和关系以定义词汇的外延的规则 该定义只是给出了建立一个本体的基本要素,即:要建立一个本体,首先要识别所处理领域的基本术语和这些术语之间的关系,而后识别组合这些术语和关系的规则,并提供这些术语和关系的定义 ◦William 和Austin(1999)指出,本体是用于描述或表达某一领域知识的一组概念或术语,可用于组织知识库较高层次的知识抽象,也可用来描述特定领域的知识◦Chandrasekaran 等人(1999)认为本体是属于人工智能领域中的内容理论,它研究特定领域知识的对象分类、对象属性和对象间的关系,为领域知识的描述提供术语。

      从以上不同研究者的定义,可以看出本体涉及到的概念为:术语(词汇)、术语关系、规则、概念化、形式化的规格说明、领域知识、表达和共享可见,本体就是通过对于概念、术语及其相互关系的规范化描述,勾画出某一领域的基本知识体系和描述语言 本体(Ontology)Ontology的概念Ontology的作用Ontology的类型Ontology的组成开发Ontology的方法构建ontology的工具当前研究存在的问题 Ontology的作用(1) 本体可以在不同的建模方法、范式、语言和软件工具之间进行翻译和映射,以实现不同系统之间的互操作和继承(2) 从功能上来讲,本体和数据库有些相似但是本体比数据库表达的知识丰富得多首先,定义本体的语言,在词法和语义上都比数据库所能表示的信息丰富得多;最重要的,本体提供的是一个领域严谨丰富的理论,而不单单是一个存放数据的结构 (3) 本体是领域内重要实体、属性、过程及其相互关系形式化描述的基础这种形式化的描述可成为软件系统中可重用和共享的组件(4) 本体可以为知识库的构建提供一个基本的结构以描述对象的类型而言:有简单事实及抽象概念,这些可以描述成一个本体的静态实体部分,它们主要描述的是事物或概念的各个组成部分以及这些组成部分之间的静态联系;本体也可以描述事物或概念的运动和变化。

      应用本体,知识库就可以运用这类结构去表达现实世界中浩如烟海的知识和常识 (5) 对于知识管理系统来说,本体就是一个正式的词汇表本体可以将对象知识的概念和相互间的关系进行较为精确的定义在这样一系列概念的支持下进行知识搜索、知识积累、知识共享的效率将大大提高,真正意义上的知识重用和知识共享也能成为现实(6) 本体适合表示抽象的描述而企业模型是人们对企业或者企业的某些模型的抽象描述,因此在企业逻辑建模中,本体的使用可以帮助我们清楚地理解企业特定领域的相关元素、关系和概念,让知识表达更加准确便捷,帮助人们进行更好的企业决策 本体在语义Web 和其它很多领域都有着广泛的应用本体的最大贡献在于它可以将某个或多个特定领域的概念和术语规范化,为其在该领域或领域之间的实际应用提供便利 本体(Ontology)Ontology的概念Ontology的作用Ontology的类型Ontology的组成开发Ontology的方法构建ontology的工具当前研究存在的问题 Ontology的类型有组织的对象的集合可被认为是本体 (Wiederhold& Jannink, 1999) ◦目录和索引(信息获取领域) ◦E-R模型(数据库领域) ◦字典词典(计算语言学领域) ◦面向对象的类定义(软件工程领域)  本体分类Uschold & Gruninger (1996) 和 Uschold (1996)分为三类◦形式化程度 高度非形式化 结构非形式化 半形式化 严格形式化 ◦目的 通讯 互操作 系统工程 re-usability, knowledge acquisition, reliability, specification ◦描述对象特殊领域本体、一般世界知识本体问题求解本体、知识表示语言本体….等 本体分类Guarino (1997)从两个方向为本体分类◦细节的程度元本体(frame ontology (Gruber, 1993a))参考 (reference)本体共享(shareable)本体领域(domain)本体◦独立的程度顶级(top-level)本体任务(task)本体应用程序(application)本体, 本体分类Gomez-Perez & Benjamins (1999)◦知识表示本体 (e.g 形式化本体 formal ontology)◦常识本体 (e.g  CYC ontology)◦顶级本体(top-level)  (e.g  Sowa’s boolean lattice, PANGLOSS, PenmanUpper Level, Mikrokosmos, WordNet upper level)◦metaontology/generic ontology/core ontology                                                           (e.g., mereology ontology)◦domain ontology      (e.g., EngMath ontology, PhysSys, Enterprise, TOVE, (KA)2, and so on)◦linguistic ontology    (e.g., WordNet, Sensus, GUM)◦task ontology           (domain-task ontology, method ontology, application ontology) 一种常用的分类◦通用本体(General Ontology)◦领域本体(Domain Ontology)◦ 任务本体(Task Ontology)◦应用本体(Application Ontology)◦Web Ontology 通用本体(General Ontology)◦描述的是最普遍的概念及其概念之间的关系,如空间、时间、行为、事件等,与具体的应用无关,其它的Ontology均为其特例。

      领域本体(Domain Ontology)◦描述的特定领域中的概念及其概念之间的关系 任务本体(Task Ontology)◦描述的是特定任务或行为中的概念及概念之间的关系应用本体(Application Ontology)◦描述的是依赖于特定领域和任务的概念和概念之间的关系Web Ontology Web ontology: ◦为semantic web服务的ontology◦表示语言:  RDF schema◦开放性 vs. 封闭性,整个web共享 vs. 系统内共享经常更新 vs. 系统建成后很少更新 本体(Ontology)Ontology的概念Ontology的作用Ontology的类型Ontology的组成开发Ontology的方法构建ontology的工具当前研究存在的问题 Ontology的组成Gruber提出了一种四元素表示方法,即一个本体中的四个主要元素是:◦概念(concepts)◦关系(relations)◦实例(instances)◦公理(axioms) 概念◦概念表示某个领域中一类实体或事物的集合通常概念可以分成两大类,一类是简单概念(primitive concepts),另一类是定义的概念(defined concepts)。

      ◦简单概念是那些只有必要条件的类成员关系￿(primitive concepts are those which only have necessary conditions (in terms of their properties) for membership of the class.)例如:正方形是四个角都是直角的四边形因此所有的正方形的四个角都是直角,但允许一些四个角都是直角的四边形不是正方形◦定义的概念是指关于一个事物是另一个类成员的既充分、又必要的描述(Defined concepts are those whose description is both necessary and sufficient for a thing to be a member of the class.)例如:“三好学生”是学习好、身体好、思想好的学生三好学生一定是学习好、身体好、思想好,而学习好、身体好、思想好的学生就是三好学生￿ 关系◦关 系 描 述 概 念 和 概 念 的 属 性 的 交 互( Relations  describe  the  interactions between concepts or a concept‘s properties.)。

      关系也可以分为两大类:一种是树状分类学关系;另一种是联合关系￿ ◦分类学将概念组织成子类-超类状的概念树结构(Taxonomies  that  organize  concepts into sub- super-concept tree structures.)最常见的分类形式是:专门化关系(Specialization relationships)通常被认为是“××是一种××”的关系例如:博士生是研究生,而研究生是学生部分关系(Partitive relationships)是描述一个概念部分的是另一个概念例如:部分博士研究生是在职的工作人员￿ ◦联合关系是指树状结构概念之间的横向关系常见的联合关系如下:主格关系描述概念的名称(Nominative relationships describe the names of concepts)位置关系描述一个概念与其他概念的的相互位置关系(Locative relationships describe the location of one concept with respect to another)结合的关系表示功能等(Associative relationships that represent, for example, the functions, processes a concept has or is involved in, and other properties of the concept)。

      还有一些其它的关系类型,如因果关系(causative‘ relationships)、参照关系等  与概念一样,关系也可以被组织成分类树状的结构关系也有属性,这些属性可深入刻画、描述概念之间的关系 实例◦是概念表示的具体的事物,如:北京师范大学是概念“大学”的一个实例◦严格的说,一个本体不应该包括任何实例,因为它被假设为一个具体领域的概念化一个本体与相关的 实 例 的 组 合 就 是 我 们 如 今 所 称 呼 的 知 识 库(knowledge base)◦然而判断一个东西是否是某个概念的实例实际上是很困难的,通常它依赖于具体的应用例如:化学元素是个概念,钾是化学元素的一个实例但是关于钾是化学元素的一个实例的判定却是有争议的,因为钾本身是一个概念,它表示不同的钾和钾的同位素这是本体研究中的一个重要问题￿ 公理◦用来限制类和实例的取值范围,公理中包括许多具体的规则和约束◦典型的是数据类型和取值范围 本体(Ontology)Ontology的概念Ontology的作用Ontology的类型Ontology的组成开发Ontology的方法构建ontology的工具当前研究存在的问题 开发Ontology的方法一般过程◦(1)目标:确定ontology的目标,是为组织某一专业领域的知识提供框架体系。

      ◦(2)未加工的数据:这一步为ontology的构建提供未加工的数据在此,不止包含概念(例如:corn rootworm 玉米食根线虫、peanut 花生、leaf 叶片),还有概念间的重要关系(例如:一种特定害虫发生在一个叶片上,一种特定害虫引起一种特定的病害)◦(3)得到一份原始的词表清单:利用软件提取记号并完成简单的统计计算,可以从未加工的数据中提取一份术语清单应用统计软件,可以得到出现在未加工文本中频率最高的记号样本在这种分析中,被确定的术语也是用来构建ontology的概念基础重要的是区分术语,它们是用一种特定的自然语言表达的,还要区分表达术语含义的概念 ◦(4)鉴定、识别初始的分类法:利用前边确定的概念清单形成初始的分类法鉴定和识别对于维持分类法的一致性很重要,分类体系的结构化需要调整每一个概念新概念(不是原始数据的一部分)的引入是为了描述相关概念的类别分类体系的顶部应该是最为抽象的概念◦(5)添加限制条件与公理:通过添加属性、属性限制和公理表达的各个概念间的关系,分类体系中的概念得到进一步的完善例如,“plant”可以有“pest”属性,这个属性必须是“pest”类目的成员。

      一种作物的组成部分必须是“plant part”的成员事件可以有描述代理和对象的属性 ◦(6)一致性检验:如果包含的关系集得到了正确的描述,那么属性限制和公理集对于任何类的子类均为真任何额外的、强加在子类上的限制,必须与子类所继承的、对母类的限制条件相一致一致性可以得到自动检验◦(7)ontology不断变化:当概念不断地添加进来,ontology也随之变化这种变化是一个可持续的过程◦(8)评价ontology:部分观点认为,构建ontology的最初目的一经满足,就算是完成了任务在一个图像库ontology的实例中,如果来自媒介汇编的图像通过附加在概念后得到了分类,那么这个ontology还算是比较完备通过查看用户怎样利用这个ontology来定位特殊图像,可以进行相关评价 本体(Ontology)Ontology的概念Ontology的作用Ontology的类型Ontology的组成开发Ontology的方法构建ontology的工具当前研究存在的问题 构建构建ontology的工具的工具Ontolingua Server (http://www.ksl-svc.stanford.edu:5915)Ontosaurus(http://www.isi.edu/isd/ontosaurus.html)WebOnto( http://webonto.open.ac.uk)PROTÉGÉ(http://protege.stanford.edu)OntoEdit(http://www.ontoprise.de/) Ontolingua Server◦Ontolingua服务器和Ontosaurus提供的翻译程序能够生成以期望的语言写成的ontology(第一版草案)￿。

      ◦Ontolingua服务器是拥有最大的用户团体的工具其编写ontology的语言是Ontolingua语言该工具有一个保存ontology的文库,其中的ontology能够被复用,以构建其它ontology,而且任何人均可向文库中添加ontology并使它也可以被别人使用因此,世界各地不同的用户将能够协作构建ontology这种工具允许不同的用户在小组研讨会中同时对一个ontology产生影响除此之外,它还有良好的教程软件 Ontosaurus◦Ontosaurus是一个可以对用LOOM编写的知识库进行浏览的Web浏览器Ontosaurus的文库中只有少量可以使用的ontology◦这种工具对初级用户来说不易于使用,且一个ontology一次只能被一个用户编辑Ontology可以用不同的语言输入或输出 WebOnto◦用WebOnto构建的ontology是用OCML(Operational Conceptual Modelling Language:计算概念建模语言)编写的,OCML是一种图形语言WebOnto没有输出功能,任何人一次只能编辑一个ontology(当用户换人时这个ontology将被锁定)。

      PROTÉGÉ◦PROTÉGÉ也拥有大型的用户团体,但是这种工具只能局部安装PROTÉGÉ v1.7能进行ontology的创建,并且为了录入ontology实例,系统会自动生成知识获取工具PROTÉGÉ没有协作或输出功能对初级用户而言,它非常易于使用,但它本身没有ontology文库PROTÉGÉ还提供ontology的图形表达方法 OntoEdit◦OntoEdit是分层构建ontology系统工程的工作平台,是一种ontology工程环境,它利用图形手段支持ontology的开发与维护◦OntoEdit构建在一个强大的内部ontology模式之上这一内在的ontology模式可以通过XML的利用得到串行化(一个接着一个),XML支持内部文档的处理◦OntoEdit的词形变化表尽可能地支持面向概念、关系和公理的表达语言中立建模包含在ontology中的几种图形视窗支持ontology工程周期的几个不同的建模阶段 本体(Ontology)Ontology的概念Ontology的作用Ontology的类型Ontology的组成开发Ontology的方法构建ontology的工具当前研究存在的问题 当前研究存在的问题迄今为止,已有为数不少的ontology构建工具和方法体系,但没有一个是完全成熟或者已经拥有了权威团体客户的。

      因此,没有一种成为现行标准Web上也未出现一个非常成熟完善的、可以进行真正的自然语言检索的,基于ontology的语义检索工具目前存在的问题归结起来有以下几点:◦(1)缺乏构建Domain ontology(领域本体)的成熟流程、方法和标准规范 ◦(2)目前的很多基于ontology的系统其应用目的是针对知识管理、语义网络和人工智能等方向,而针对自然科学的ontology系统构建相对较少这是由于ontology的研究源于AI领域,而构建Domain ontology不仅需要AI领域的本体工程师(ontology engineering),更加需要领域专家参与知识体系的构造、组织和完善,而这二者往往由于各自的专业背景和目的不同而难以达成过程上的统一◦(3)即使是构建Domain ontology,由于专业不同、学科背景不同,应用目的不同,也会带来构建方式和工艺流程上的差别,所以每个领域Domain ontology的构建均有方法体系上的特殊性(即专业特色)即使构建同一领域的Domain ontology,由于人员背景、思考角度不同,应用的框架体系不同,也会生成不同结果 ◦(4)研究ontology构建的技术体系与研究检索的技术体系之间存在脱节问题。

      使得ontology对检索系统的嵌入(登录)成为难点这还导致了ontology工程的生命周期不能顺利进行◦(5)目前,国内还未有基于ontology检索系统投入运行的报道◦(6)构建基于ontology的检索系统,其瓶颈在于基于ontology的语义标引仍停留在极为耗时的手工标引阶段某些自动化或半自动的标引手段未能达到人工标引的精细水平所以,ontology的研究仍停留在理论研究日趋成熟,应用研究相对滞后的阶段 语义网(Semantics Web)语义网概述RDF本体(Ontology)语义网描述语言 语义网描述语言RDFOILDAMLOWL RDFRDF具有较强的表达能力,但作为语义网描述语言,RDF还存在不足◦虽然RDF起源于知识表示,但RDF没有定义推理机制,RDF可被看成是一个简单的框架系统,可在其上建立推理机制 ◦RDF没有说明包含特性,尽管名字空间(namespaces)允许文档引用在另一个文档中定义的术语,但没有明确是否包含引用术语的定义◦RDF没有提供定义公理的机制,而公理可以提供更强的语义,限制术语的可能语义,推导出没有明确表示的信息,匹配相同概念的不同表示。

      如有用的公理可定义属性subOrganization具有传递性或ParentOf和childOf属性是相互可逆的 ◦ RDF的另一个潜在问题是尽管它提供了修改schema的方法,它无法完全适应web迅速变化的特点从本质上讲,schema的每个版本都拥自己的URI,被认为是资源的一个完全不同的schema,仅通过rdfs:subClsssOf 和 rdfs: subProPertyOf 与 class 和ProPerty的原始定义联系各版本间没有建立真正的等价关系如参考某个被修改schema的schema和资源要反映这个变化必须分别进行修改使用新的URI而且RDF没有版本控制 OIL OIL ◦Ontology Interchange Language 或◦Ontology lnference layer(本体推理层)◦是在Web上描述本体的语言OIL的语义基于描述逻辑(description logic),语法建立在RDF之上◦OIL的设计目标之一就是尽量与RDF应用结合,因此,大多数RDF Schemas是有效的OIL ontology,能够被RDF处理器所理解。

      与RDF不同的是OIL具有良好定义的语义 ◦OIL可分为四个层次,高层建立在低层上,在低层上增加功能 OIL的核心是基本RDFS标准OIL在核心OIL层增加了一系列的描述逻辑原语,是目前OIL工作的核心实例OIL(Instance OIL)应用RDF描述实例,增加了模型实例的能力Heavy OIL是一个未定义的层,用来包含未来对语言的扩充◦这种分层的方法使得应用可以用语言预定子集来管理复杂的OIL  OIL建立在基本的RDF、类、属性原语上,有两类基本类:◦原语类和定义类原语类是普通的RDF类定义类为成员提供必要的和充分的条件定义类要求使用类表达式,布尔表达式是类和槽限定的布尔组合OIL提供的标准布尔操作包括oil:AND、oil:OR和oil:NOT槽限定用于限制类的实例必须是满足某些范围限制的属性域实例 槽限定包括◦oil:HasValue◦oil:ValueType◦oil:MaxCardinality和oil:MinCardinalityoil:HasValue限定说明槽是特定类表达式的一个成员,必须至少有一个值oil:ValueType限定说明槽的所有值必须是特定类表达式成员。

      势限定( oil:MaxCardinality和oil:MinCardinality)说明对于特定槽至多(至少)存在的实例值oil:hasProperty用来指出限定应用的属性,oil:hasClass用于指明限定的类表示 OIL槽是RDF属性,槽定义可使用RDF结构如rdts: subelassOf、 rdfs: domain和rdts: rangeOIL还增加了属性和类对槽进行更精确的定义◦oil:inverseRelationOf属性说明两个属性是逆反关系◦如果属性是oil:TransNveProPerty类的实例,则属性是传递的◦如果属性是oil:SymmetricProPeny的子类,则它是对称关系 除了定义类和槽,OIL ontology能用元数据、输入模块描述自身并提供规则库标准元属性集合基于都柏林核心集,包括ontology名、ontology作者等输入机制使用XML名字空间,在这方面和RDF具有同样的缺憾规则库试图为ontology提供公理和全局限制,但此结构目前还未定义 OIL的优势在于以描述逻辑为基础◦如果两个ontology在定义中使用相同的术语集,自动得出包含关系来合并ontology。

      ◦此外,丰富的模型结构允许一致性检查,为构建高质量ontology提供方便缺欠◦由于实例化可引起语义网上的逻辑不一致,这方面更难以控制,目前还没有处理这种不一致的方法比如,如果Person类为marriedTo槽定义oil:maxCardinality为1,那如何处理不同的文档中都说明不同的人和Mary结婚呢?◦OIL的另一个缺陷继承自RDF:没有明确的输入机制,相对ontology发展支持不充分◦OIL还不能合成ontologies所需的清晰匹配比如OIL不能表示类和属性的同义,不能表达同一概念的不同结构间的匹配 DAMLDAML(DARPA Agent Markup Language) 是DARPA的主要项目,有多个学术和工业组织参加DAML力图包括RDF、OIL等语义网语言的优点DAML的最早版本称为DAML—ONT,但后来与OIL紧密结合形成了DAML+OIL下面如不明确说明DAML指DAML+OIL 和OIL一样,DAML建立在RDF上,以描述逻辑为基础DAML允许类表示为一个单独类、组成类的一系列实例、属性限制或类表示的布尔组合◦daml:intersectionOf◦ daml:unionOf  和￿◦￿daml:complementOf◦这些属性提供类表示的和取、析取和否定。

      DAML属性限定由daml:Restriction类指示,包括◦daml:onProperty属性说明被限定的槽和有关限定的信息,◦daml:toClass属性说明槽的所有值必须是特定类表示的成员◦daml:hasClass属性说明槽的至少一个值必须是特定类成员 DAML还有◦daml:hasValue属性说明槽的一个值必须是特定值◦和OIL一样,DAML包括势限制daml:minCardinality和daml:maxCardinality,◦由于DAML构成限定的方法不同,因此需要daml:hasClassQdaml:maxCardinalityQ和daml:minCardinalityQ属性用于特定的类表示  DAML也提供定义属性原语除了RDF本身所有的原语,DAML增加了daml:inverseOf属性和danml:TransitiveProperty类,这一点和OIL一致DAML有◦daml:UniqueProperty和◦daml:UnambiguousProperty类分别说明属性每个实例只有一个值和一个值只属于一个实例 DAML的daml:imports类是传递的,说明输入文档的定义也使用当前ontology,DAML可扩展ontology。

      DAML使用XML名字空间提供名字,名字空间声明和daml:imports声明间有冗余 DAML的daml:equivalentTo属性用来说明两个资源相同由于类和属性都是资源,这可被用来说明其他类因此daml:equivalentTo提供了重命名功能及说明两个实例相同的能力,后者在Web上非常有用,因为网上资源以URL来标识,不同的URL经常指向相同的资源,不同的用户可能是用不同的ID值指向相同一资源,使用daml:equivalentTo,两个资源的内容可被有效的合并 daml:versionInfo属性允许ontology提供版本信息但目前该属性的内容还未定义,不能用来自动决定ontologies的版本,而且没有办法指明向后兼容版本DAML还包含对XML Schema数据类型的支持所有的数据类型被看成是特殊的类,每一数据类型有唯一的由其资源文档的URL和名字构成的唯一标识  因为DAML基于描述逻辑,它同样具有OIL的优点又因为它也建立在RDF之上,也具有RDF的缺陷 OWLOWL( Web Ontology Language)W3c的标准OWL旨在用于那些需要由应用程序而不是由人类来处理文档中的信息的情形。

      OWL可被用来明确表示词汇表中术语的含义以及术语间的关系在表达含义和语义方面,OWL比XML、RDF和RDF-S有更多的表达手段,因此在Web上表达机器可理解内容的能力也比这些语言强OWL是DAML+OIL Web本体语言的修改版,并吸取了在DAML+OIL的设计和应用中得到的经验教训 OWL语言标准有六个:◦OWL概述 (http://www.w3.org/TR/owl-features/)(OWL Overview),即本文,通过列出OWL的语言特征并给出其简要的描述,对OWL进行了简单的介绍;◦OWL指南 (http://www.w3.org/TR/owl-guide/)(OWL Guide)通过一个扩展的例子说明如何使用OWL语言同时也给出了这些文档中用到的术语的解释;◦OWL参考 (http://www.w3.org/TR/owl-ref/) (OWL Reference)以一种系统的和简洁的方式(仍是非正式地)描述了OWL的所有建模原语(modelling primitives);◦OWL语义和抽象语法文档(http://www.w3.org/TR/owl-semantics/) 是对这个语言的最终的、形式化的规范性定义;◦OWLWeb本体语言测试用例文档(http://www.w3.org/TR/owl-test/)包含了这个语言的一个大量的测试用例集合;◦OWL用例和需求文档http://www.w3.org/TR/webont-req/) 包含了一个Web本体语言的用例集合和关于OWL的需求集合。

      OWL提供了三种表达能力递增的子语言,以分别用于特定的实现者和用户团体◦OWL-Lite ◦OWL-DL ◦OWL-Full 主要的分类依据就是它们的表达能力其中,OWL-Lite是表达能力最弱的子语言,OWL-Full具有最强的表达能力,而OWL-DL的表达能力则在它们之间我们可以认为OWL-DL是OWL-Lite的扩展,而OWL-Full是OWL-DL的扩展 OWL-Lite◦从语法上来说,OWL-Lite是三个之中最简单的一个,当本体中类的层次结构很简单,并且只有简单的约束(constraint)时适合使用它来描述本体例如,在需要把一个已存在的辞典(thesauri)移植到另一个差不多简单的概念层次时,OWL-Lite可以做得又快又好 OWL-DL◦和OWL-Lite相比,OWL-DL的表达能力要丰富许多,它的基础是描述逻辑(Description Logics,即DL的由来)◦用于支持那些需要最强表达能力而需要保持计算完备性(computational completeness,即所有的结论都能够确保被计算出来)和可判定性(decidability,即所有的计算都能在有限的时间内完成)。

      ◦OWL DL包括了OWL语言的所有语言成分,但使用时必须符合一定的约束,例如,一个类可以是多个类的子类时,但它不能同时是另外一个类的实例 OWL-Full◦OWL-Full是OWL的三种子语言中表达能力最强的一个◦支持那些需要尽管没有可计算性保证,但有最强的表达能力和完全自由的RDF语法的用户例如,在OWL Full中,一个类可以被同时看为许多个体的一个集合以及本身作为一个个体它允许在一个本体增加预定义的(RDF、OWL)词汇的含义这样,不太可能有推理软件能支持对OWL FULL的所有成分的完全推理 在表达能力和推理能力上,每个子语言都是前面的语言的扩展这三种子语言之间有如下关系成立,但这些关系反过来并不成立◦每个合法的OWL Lite本体都是一个合法的OWL DL本体;◦每个合法的OWL DL本体都是一个合法的OWL Full本体;◦每个有效的OWL Lite结论都是一个有效的OWL DL结论; ◦每个有效的OWL DL结论都是一个有效的OWL Full结论 OWL本体的组成本体的组成OWL有◦个体(Individual)◦属性(Property)◦类(Class) 个体(个体(Individual))◦个体代表(领域中)我们实际感兴趣的那些对象,◦OWL不使用唯一命名假设(Unique Name Assumption,UNA),也就是说,两个不同的名称可以对应到同一个个体。

      例如“伊丽莎白女王”、“女王”和“伊丽莎白.温莎”可能都对应同一个人◦在OWL里,必须明确的表达个体之间是否为相同的,否则它们可能相同也可能不相同◦个体(Individual)有时也被称作实例(Instance),个体相当于类的实例 属性(属性(Property))◦属性是个体之间的二元关系,也就是说,属性把两个个体连接在一起例如属性hasSibling(兄妹)可能会把Matthew和Gemma这两个个体连接起来,而属性hasChild会把Peter和Matthew这两个个体连接起来;属性可以有反向属性(Inverse),例如hasOwner的反向属性是isOwnedBy;属性也可以被限制为只能拥有一个值,即所谓的函数属性(functional);属性还可以是具有传递性(transitive)或是对称的(symmetric)  类(类(Class))◦OWL中的类代表一些个体的集合,OWL使用形式化(数学的)的方法精确描述出该类中成员必须具有的条件,例如,领域中全部猫的个体都属于Cat类◦类可以通过继承关系组成层次结构,子类是父类中的特殊情况,例如考虑Animal和Cat这两个类,Cat可以是Animal的一个子类(即Animal是Cat的父类),这就表示了:所有的猫都是动物,所有Cat类的成员都是Animal类的成员,如果你是猫那么你也是动物,Cat类被Animal类所包含,等等。

      OWL-DL的一个重要特征就是父类和子类之间的(包含)关系可以被推理机自动计算出来 作业(二选一)使用任意一种Web Services实现的工具(例如Xfire、AXIS2)实现一个简单的“Hello, World”Web Services,作业应当包括相关的实现软件代码以及对应的WSDL使用RDF及vcard命名空间描述你本人的姓名、昵称及电子邮件,作业应当以RDF/XML格式提交。

      点击阅读更多内容
      相关文档
      安徽省安全员《A证(企业负责人)》冲刺试卷三.docx 2026年房地产经纪人《房地产经纪业务操作》预测试卷三.docx 安徽省安全员《A证(企业负责人)》模拟试卷一.docx 2026年房地产经纪人《房地产交易制度政策》模拟试卷四.docx 安徽省安全员《B证(项目负责人)》冲刺试卷二.docx 2026年房地产经纪人《房地产经纪专业基础》预测试卷四.docx 2026年房地产经纪人《房地产经纪业务操作》考前点题卷一.docx 2023年通信工程师《通信专业实务(传输与接入-无线)》试题真题及答案.docx 安徽省安全员《A证(企业负责人)》试题精选.docx 2026年房地产经纪人《房地产经纪专业基础》预测试卷二.docx 2026年房地产经纪人《房地产经纪业务操作》考前点题卷二.docx 2026年房地产经纪人《房地产经纪职业导论》冲刺试卷三.docx 2026年房地产经纪人《房地产交易制度政策》冲刺试卷三.docx 2026年房地产经纪人《房地产经纪专业基础》考前点题卷二.docx 2026年房地产经纪人《房地产经纪职业导论》冲刺试卷五.docx 2026年房地产经纪人《房地产经纪职业导论》冲刺试卷四.docx 2026年房地产经纪人《房地产交易制度政策》冲刺试卷一.docx 2026年房地产经纪人《房地产交易制度政策》冲刺试卷四.docx 安徽省安全员《B证(项目负责人)》冲刺试卷三.docx 2026年房地产经纪人《房地产经纪业务操作》模拟试卷二.docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.