
意义的计算知网的进展与应用PPT课件.ppt
26页意义的计算意义的计算 -- 知网的进展与应用知网的进展与应用讨论题目讨论题目u 不变的是什么?不变的是什么?u 变了什么?变了什么?u 变成什么样了?变成什么样了?不变的是什么(不变的是什么(1 1))u《知网》的性质《知网》的性质 -- 描述概念与概念之间的关系,以及描述概念与概念之间的关系,以及概念的属性与属性之间的关系的知识库概念的属性与属性之间的关系的知识库 Dong Zhendong, "Knowledge Description: What, How and who?", Proceedings of International Symposium on Electronic Dictionary, Tokyo, 1988, p.18不变的是什么(不变的是什么(2 2))u《知网》的哲学《知网》的哲学 --知识是知识是关系关系的系统,是概念与概念之间的的系统,是概念与概念之间的关关系系,概念的属性与属性之间的,概念的属性与属性之间的关系关系的系统的系统 -- 万物万物都在特定的都在特定的时空时空中变化,从一种中变化,从一种状态状态转变为另一种状态,这样的转变体现于它的转变为另一种状态,这样的转变体现于它的属属性性的变化的变化 -- 本质属性本质属性或或非本质属性非本质属性的差别决定概念之的差别决定概念之间的差别间的差别不变的是什么(不变的是什么(3 3))u《知网》的建构理念和设计《知网》的建构理念和设计 -- 关系关系是灵魂,揭示关系是《知网》是灵魂,揭示关系是《知网》的中心的中心 -- 基于义原(基于义原(sememesememe),),特征的静态特征的静态描述为主描述为主 -- 采用动态角色激活静态特征采用动态角色激活静态特征 -- 面向计算机面向计算机多层语义关系网络(多层语义关系网络(MLRN))《知网》的知识获取与表达《知网》的知识获取与表达 -- 义原义原(sememe)u 义原义原的认定的认定u 义原义原的提取的提取u 中文字义为基础中文字义为基础 4,000汉字汉字 2,200义原义原u 英文词义为对照英文词义为对照u 义原的范畴义原的范畴义原的范畴义原的范畴实体实体 万物万物 (物质、精神、事情)(物质、精神、事情) 部分部分 (部件、配件)(部件、配件) 时间时间 空间空间 (方向、位置)(方向、位置)事件事件 (关系(关系/状态、动作)状态、动作)属性属性属性值属性值 (外观、量度、特性、关系、状况)(外观、量度、特性、关系、状况)数量数量数量值数量值变了什么?变了什么?u《知网》的知识词典描述语言(《知网》的知识词典描述语言(KDML),),从原来的从原来的线性的描述方式改进为树型的、可嵌套的描述方式;线性的描述方式改进为树型的、可嵌套的描述方式;原来的各种关系的表示从隐性、有的含混的变为显性原来的各种关系的表示从隐性、有的含混的变为显性的、无含混的。
的、无含混的 u对属性和属性值义原做了重大的调整和补充同时对对属性和属性值义原做了重大的调整和补充同时对其他义元表也做了相应的调整其他义元表也做了相应的调整 u增加了一些各种关系的检索模式增加了一些各种关系的检索模式 u增加了事件关系与动态角色转换模块增加了事件关系与动态角色转换模块 u将《中文信息结构库》进行了规则化处理,并针对这将《中文信息结构库》进行了规则化处理,并针对这些规则编写了相应的解释器些规则编写了相应的解释器《知网》采用的义原《知网》采用的义原 1503 => 2199实体实体 141 => 153 万物万物(物质、精神、事情、组织)(物质、精神、事情、组织) 134 => 146 部分部分(部件、配件)(部件、配件) 3 时间时间 1 空间空间(方向、位置)(方向、位置) 3事件事件(关系(关系/状态、动作)状态、动作) 813 => 817属性值属性值(外观、量度、特性、关系、状况)(外观、量度、特性、关系、状况) 316 => 859数量值数量值 13 => 18属性属性 117 => 236 数量数量 6次要特征次要特征 99 => 110HowNetHowNet 释义一例释义一例W_C=W_C=店店G_C=NG_C=NE_C=E_C=旅旅~ ~,星级饭,星级饭~ ~,黑,黑~ ~,住,住~ ~,,~ ~里没空房,住酒里没空房,住酒~ ~,星级酒,星级酒~ ~W_E=innW_E=innG_E=NG_E=NE_E=E_E=DEF={DEF={InstitutePlaceInstitutePlace| |场所场所:{:{eat|eat|吃吃: :location={~}},{reside|location={~}},{reside|住下住下: :location={~}},{recreation|location={~}},{recreation|娱乐娱乐: :location={~}},location={~}},RelateToRelateTo={tour|={tour|旅游旅游},},domain={economy|domain={economy|经济经济}}}}W_C=W_C=店店G_C=NG_C=NE_C=~E_C=~铺,商铺,商~ ~,夫妻,夫妻~ ~,夫妻老婆,夫妻老婆~ ~,便民,便民~ ~,小卖,小卖~ ~,专卖,专卖~ ~,书,书~ ~,布,布~ ~,药,药~ ~,花,花~ ~,小吃,小吃~ ~,精品,精品~ ~,礼品,礼品~ ~,玩具,玩具~ ~,服装,服装~ ~,烟纸,烟纸~ ~,南货,南货~ ~,食杂,食杂~ ~,宠物,宠物~ ~W_E=shopW_E=shopG_E=NG_E=NE_E=E_E=DEF={DEF={InstitutePlaceInstitutePlace| |场所场所:{:{sell|sell|卖卖: :agent={~}},{buy|agent={~}},{buy|买买: :location={~}},domain={economy|location={~}},domain={economy|经济经济}}}} KDML改进改进W_C=北麓北麓G_C=NE_C=W_E=northern foot of a mountainG_E=NE_E=((原)原)DEF=part|部件部件,%land|陆地陆地,base|根根((新)新)DEF={part|部件部件:whole={land|陆陆 地地:PartPosition={base|根根}},modifier={north|北北}}KDML改进改进W_C=被告人被告人G_C=NW_E=accusedG_E=NDEF=human|人人,$accuse|控告控告,police|警警DEF={human|人人:{accuse|控控 告告:patient={~}},domain={police|警警}}W_C=被告席被告席G_C=NW_E=dockG_E=NDEF=location|位置位置,@sit|坐蹲坐蹲,#accuse|控告控告,police|警警DEF={location|位置位置:{sit|坐蹲坐蹲:location={~},agent={human|人人:{accuse|控告控告:patient={~}},domain={police|警警}}}}WordNetWordNet 释义一例释义一例The noun shop has 2 senses (first 2 from tagged texts) 1. shop, store -- (a mercantile establishment for the retail sale of goods or services; "he bought it at a shop on Cape Cod")2. workshop, shop -- (small establishment where handcrafts or manufacturing are done)概念描述的举例概念描述的举例 ((1 1))医生:医生:DEF={human|人人:domain={medical|医医}, HostOf={Occupation|职位职位},{doctor| 医治医治: agent={~}}}患者:患者:DEF={human|人人:domain={medical|医医}, {SufferFrom|罹患罹患:experiencer={~}}, {doctor|医治医治:patient={~}}}医院医院:: DEF={InstitutePlace|场所场所:{doctor|医治医治: location={~},content={disease|疾病疾病}}, domain={medical|医医}}概念描述的举例概念描述的举例 ((2 2))病历:病历:DEF={document|文书文书:{record|记录记录: content={disease|疾病疾病},LocationFin={~}}, domain={medical|医医}}健康:健康:DEF={Health|健康健康: host={AnimalHuman|动物动物}}多病:多病:DEF={unhealthy|不健不健} │ │ ├ {HealthValue|健康值健康值} │ │ │ ├ {healthy|康健康健} │ │ │ └ {unhealthy|不健不健} 概念描述的举例概念描述的举例 ((3 3))病:病:{disease|疾病疾病} {phenomena|现象现象: {doctor|医治医治:content={~}},{SufferFrom|罹患罹患 :content={~}},RelateTo={medicine|药物药物} {Health|健康健康}{HealthValue|健康值健康值}, domain={medical|医医}}药:药: {medicine|药物药物} {artifact|人工物人工物:{doctor|医治医治 :instrument={~}},RelateTo={disease|疾病疾病}, domain={medical|医医}{chemistry|化学化学}}《知网》的灵魂《知网》的灵魂 – 关系关系1. 上下位上下位2. 事件必要角色框架事件必要角色框架3. 事件关系与角色转换事件关系与角色转换4. 同义同义5. 反义反义6. 对义对义7. 整体整体-部件部件8. 宿主宿主-属性属性9. 属性属性-属性值属性值10. 实体实体-相应事件相应事件11. 制成品制成品-材料材料12. 各种动态角色关系各种动态角色关系上下位关系上下位关系 ((1))- {entity|实体实体} ├ {thing|万物万物} {entity|实体实体:{ExistAppear|存现存现:existent={~}}} │ ├ {physical|物质物质} {thing|万物万物:{HostOf={Appearance|外观外观}},{perception|感知感知:content={~}}} │ │ ├ {animate|生物生物} {physical|物质物质:{HostOf={Age|年龄年龄}},{alive|活着活着:experiencer={~}},{die|死死:experiencer={~}},{metabolize|代谢代谢:experiencer={~}},{reproduce|生殖生殖:agent={~}},{reproduce|生殖生殖:PatientProduct={~}}} │ │ │ ├ {AnimalHuman|动物动物} {animate|生物生物:{HostOf={Sex|性性别别}},{AlterLocation|变空间位置变空间位置:agent={~}},{StateMental|精神精神状态状态:experiencer={~}}} │ │ │ │ ├ {human|人人} {AnimalHuman|动物动物:{HostOf={Name|姓名姓名}{Wisdom|智慧智慧}{Ability|能力能力}},{think|思考思考:agent={~}},{speak|说说:agent={~}}} 上下位关系上下位关系 ((2))- {event|事件事件} ├ {static|静态静态} │ ├ {relation|关系关系} │ │ ├ {isa|是非关系是非关系} │ │ │ ├ {be|是是} {relevant,isa}/{relevant,descriptive} │ │ │ │ ├ {become|成为成为} {relevant,isa}/{relevant,descriptive} │ │ │ │ └ {mean|指代指代} {relevant,isa}/{relevant,descriptive} │ │ │ └ {BeNot|非非} {relevant,isa}/{relevant,descriptive} │ │ ├ {possession|领属关系领属关系} │ │ │ ├ {own|有有} {possessor,possession} │ │ │ │ ├ {obtain|得到得到} {possessor,possession,source} │ │ │ │ └ {receive|收受收受} {possessor,possession,source} │ │ │ ├ {BelongTo|属于属于} {possessor,possession} │ │ │ ├ {OwnNot|无无} {possessor,possession} │ │ │ │ └ {lose|失去失去} {possessor,possession} │ │ │ │ └ {InDebt|亏损亏损} {possessor,possession} │ │ │ └ {owe|欠欠} {possessor,possession,target}事件动态角色事件动态角色 ((1)){Event Role and Features} ├ {EventRole} 动态角色动态角色 │ ├ {relevant} 关系主体关系主体 │ ├ {existent} 存现体存现体 │ ├ {experiencer} 经验者经验者 │ ├ {agent} 施事施事 │ ├ {coagent} 合作施事合作施事 │ ├ {possession} 占有物占有物 │ ├ {patient} 受事受事 │ ├ {PatientPartPosition} 部件部位受事部件部位受事 │ ├ {PatientProduct} 成品受事成品受事 │ ├ {PatientAttribute} 受事属性受事属性 │ ├ {PatientaValue} 受事属性值受事属性值 事件动态角色事件动态角色 ((2)) │ ├ {PartOfTouch} 触及部件触及部件 │ ├ {content} 内容内容 │ ├ {ContentProduct} 内容成品内容成品 │ ├ {ResultContent} 结果内容结果内容 │ ├ {isa} 类指类指 │ ├ {PartOf} 部分部分 │ ├ {whole} 整体整体 │ ├ {host} 宿主宿主 │ ├ {HostOf} 之宿主之宿主 │ ├ {descriptive} 描写体描写体 │ ├ {result} 结果结果事件关系和角色转换事件关系和角色转换 sorrowful|悲哀悲哀 weep|哭泣哭泣 [consequence]; experiencer OF sorrowful|悲哀悲哀=agent OF weep|哭泣哭泣; cause OF sorrowful|悲哀悲哀= cause OF weep|哭泣哭泣;BeBad|衰变衰变 [cause]sorrowful|悲哀悲哀; experiencer OF BeBad|衰变衰变=experiencer OF sorrowful|悲哀悲哀; BeBad|衰变衰变 ITSELF=cause OF sorrowful|悲哀悲哀. unfortunate|不幸不幸BeBad|衰变衰变 [hypernym]; experiencer OF unfortunate|不幸不幸=experiencer OF BeBad|衰变衰变. defeated|输掉输掉BeBad|衰变衰变 [hypernym]; experiencer OF defeated|输掉输掉=experiencer OF BeBad|衰变衰变.实体实体-属性属性-属性值的关系属性值的关系头头/发型:发型:{Pattern|样式样式:host={part|部件部件:whole={human|人人},PartPosition={hair|毛毛}}}PatternValue|样式值样式值 = Value of Pattern|样式样式├ {fashionable|时髦时髦}└ {unfashionable|背令背令}《知网》的应用《知网》的应用1. 语料库语义标注:语料库语义标注:香港科技大、清华香港科技大、清华2. WSD,,Sense Pruning::山大、台湾中研院、山大、台湾中研院、 厦大、香港科技大厦大、香港科技大3. 敏感信息发现:敏感信息发现:解放军某部解放军某部4. 信息过滤:信息过滤:厦大厦大5. Personalized IR::计算所计算所6. Semantic Web::台湾工研院台湾工研院7. 与与WordNet比较研究:比较研究:马里兰大学、香港科技大马里兰大学、香港科技大欢迎提问和批评欢迎提问和批评。












