
知识获取技术探析.pdf
4页第17卷 第5期交 通 与 计 算 机VOL. 17 No. 51999年10月Computer and CommunicationsOctober. 1999收稿日期: 1999- 07- 01知 识 获 取 技 术 探 析闵 联 营(武汉交通科技大学 武汉430063)摘 要 文章分析了造成知识获取困难的一些主要原因,并介绍了有效获取知识的技术 关键词 人工智能 专家系统 知识获取 知识表达1 知识获取的基本过程1. 1 知识工程师及其作用 知识获取是建立专家系统最基本最重要的过 程,它一般是由一个具有计算机知识的人(称为知 识工程师)来完成在这个过程中,知识工程师作 为一个中介者,促进知识从专家的头脑中转移到 专家系统中这个过程之所以特别重要是因为在专家系统中实际被反映的是知识工程师而不是专 家的知识 因此知识工程师必须十分仔细、 准确的 表现专家的思想1. 2 知识获取的基本过程图1 知识获取过程知识获取的基本过程见图1过程的第一步,领域的理解是一个大体的熟悉过程这一步开始 于知识工程师与专家非正式的初次会见,会见的目的是: ·在相互尊重的基础上开始建立知识工程师与专家之间的关系知识,工程师尊重专家的专业知识,专家佩服工程师在这个领域的重要性和学习的意愿(能力)。
这种关系可以类比于师傅与学徒 如果友善关系不能建立,那么就得重新找一个专家或知识工程师,或者干脆放弃这个计划·向知识工程师提供对这一问题领域高水平的概念·使专家熟悉专家系统的概念和专家与知识工程师各自的任务 如果可能的话,知识工程师应向专家展示一个类似的已有的系统例子知识工程师必须与专家保持良好的私人工作关系,以便充分交流 同时知识工程师还必须特别注意从可获取的资料中得到信息这些资料包括对问题的总体描述的介绍资料,相关的参考书,描述该领域的术语表(包括术语、 缩略词以及该领域的专用符号),因为这些概述和词汇知识在任何领域都是最基本的一种知识类型2 知识获取的困难和原因2. 1 知识获取遇到的困难在理解领域告一段落之后,要对用于初步实现的样本问题予以确认问题确认应该以一种宽度优先的方法开始具体做法是宽度优先的分析确定一个用于限制总体问题范围的一般性问题的清单从这份清单中选择出由知识工程师和专家共同确认的特殊问题;这些问题应该是典型的、 重要的,并且是被充分理解了的在选择过程之后,三个最关键的活动同时开始——概念表述、 样本问题实现和知识表达开发样本问题的实现是由知识工程师进行的,他与专家就如何解决问题进 行商议。
随着其它过程的进行,用来表示概念和解 决问题的知识的知识结构逐渐形成 在这期间,有 可能出现四个难题: ·在某些领域,专家可能不具有所需的知识;·专家也许不很清楚什么是所需的知识; ·专家也许不能将知识传授给知识工程师; ·知识工程师也许不能建构基础知识框架 出现这些问题是一个普遍的现象不仅在开 发专家系统时发生,我们在开发M IS系统时也经常或多或少的出现上述问题2. 2 知识获取困难的原因 为了从根本上弄清知识获取困难的原因,可 以将专家的表现作为认知行为的一个例子认知 心理学家对专家解决问题的行为研究了多年并从理论上来解释它们一些关键要点对于专家系统 是十分重要的 ·专家通常不会按照课本一类的条文来直接 推理通常,专家倾向于利用一种模式化的方法, 它依赖于对巨大知识分块或分组来快速认识在许领域(例如象棋)中,这是专家经验的重要方面, 它来自于专家通过多年的经验积累所形成的大量 已汇编过的知识这些知识使专家以本能的反应 来快速对问题作出响应而不必过多考虑细节步 骤·专家的知识是下意识的储存的不幸的是 虽然这增加了专家的能力,但同时它也使专家更 难解释处理问题的活动同样道理,一个已汇编 知识的专家系统难于解释它的活动。
) ·专家发现他比初学者更难于解释自己的活动因为专门技术时常来源于专家难以描述的潜 在意识知识 上述三条就是知识获取困难的主要或者说是 根本的原因,所以有必要开发知识获取技术3 知识获取技术3. 1 知识获取的三种形式 知识获取活动是在知识工程师和专家之间关 于问题解决方案的一些交互作用的形式概念的核 心这种交互作用通常是三种标准形式之一·描述:在工程的最初阶段采用何种形式描 述是最适合的并不清楚,专家提供了这一领域的 框架描述通常被首先采用主要是因为它的表现 类型与课本和正式讲座中提供的相类似,它有利于建立背景知识 然而,它对实际的系统开发价值 有限,主要因为它只提供了理想化的解决问题方 案并省略了大量的策略信息 ·观察:在这种情形下,知识工程师只是简单 地(无打扰地)在实际解决问题的环境中观察专家当知识工程师建立了该领域合理的能力水平 后,这种活动是非常有价值的,它使得知识工程师 可以在实际的环境中观察解决问题的细节 ·内省:在这种方式的交互作用中进行了一 种对解决问题的环境的中立的评估这使得知识工程师可以交互性地寻求所需的知识 这三种交互活动通常以所示的顺序出现在既 定的项目中3. 2 知识获取应该是分层次的 在样本的确认以前应该是一种宽度优先的方法确定出的样本清样。
一旦知识工程师建立了对 该领域的全面认识,知识工程师与专家共同确定 了样本问题以后,问题分析应该是自顶向下、 逐层 分解的这对于知识工程师和专家双方都是有利 的 对专家是很自然的,因为专家知识是分层储存的 它对知识工程师也是有用的,因为它将整个领 域分解成易处理的子块3. 3 诱导知识和准确理解知识 专家的知识如果没有与解决问题相联系起 来,要想完全恢复知识是很困难的,因为知识是下意识储存的知识工程师应采取各种办法诱导知 识 一般地,可以选择一种或几种特定的问题以便 研究 可以是某个实际问题的分析,也可以是解决 某个实际问题的回顾 例如:在诊断领域知识工程 师会请专家描述一下当他观察到一种特殊症状时所做的第一件事专家和知识工程师顺着这个例 子继续进行下去并对每一步所代表的知识进行分 析 因为这一过程是自顶向下进行,所以第一个 解释应该十分全面 实际上,对所有问题的分析都至少进行三遍 第一遍建立一个全面的概念,第二 遍开始明确地叙述知识块,第三遍(以及以后几 遍)阐明细节在这个过程中,知识工程师每一遍 的理解即使是抽象的,但仍应该是全面和正确的 如果在某一点上知识工程师不明白专家的描述,他必须寻求澄清或者记下它以便下一遍解决。
这 个过程持续于问题的始终 即使这样,专家仍将忽 略许多重要的解决问题的细节 忽略是有原因的, 因为知识是下意识储存的,专家甚至没有意识到33第5期 闵联营:知识获取技术探析细节被忽略了 细节之所以被忽略是因为专家适应了以一种 适合于听众的细节水平进行解释专家的解释通 常有许多技术术语和专业问题的描述 相反,提供 给初学者的解释要抽象得多这种类型的解释通常避免复杂和细微的差别,它对于初学者避免混 淆并对问题建立起码的肤浅的理解十分必要因 为专家将知识工程师就看作初学者,所以这种类 型的解释就提供给了知识工程师知识工程师对 其进行分析,并将其分解以判断它包括了哪些关键性的知识以及是否缺乏某些细节或跳跃了过程 所需的步骤 如果是,这时知识工程师必须提醒专 家他感兴趣的是过程所需的详细的步骤而不只是 最后的结果 知识工程师必须追根问底直到满意的细节水平为止,同时知识工程师的责任还包括帮助专家 建立连贯、 完整的知识必要的时候,他应该向专 家重新表述一遍以求确认这将使知识工程师和 专家共同掌握所需知识3. 4 概念表述对重要的概念的识别和表述同时发生,都是 样本实现过程的副产品。
概念分为范围概念和策 略概念 表述范围概念最重要的技术是确认该概念包 括的子任务每个子任务应该有一个命名专家表述策略要比表述事实的知识困难得 多因此知识工程必须更加积极地了解在会谈中 专家间接描述的策略知识工程师应对每个重大 的计划命名和描述同时也应尽量确定该领域中 包含不定项的类型以及它们是怎样进行的为了与概念性的知识紧密结合,知识工程师 必须发现一个潜在的域模型通过比较不同域之 间的相似关系经常会发现一个域模型例如一个 具有电子工程背景的知识工程师在波导领域建模 时会识别在管中的水流和在导线中的电流的紧密联系 理解了基本概念并建立了潜在的模型后,要 求知识工程师有较强的类推能力,以便用一个更 全面的概念包含前面的多个概念,尽量找到潜在 的统一的概念3. 5 知识表达法的开发知识表达法在研究专家系统中占有重要的地 位,也是相当困难的部分 有幸的是在这个领域已 有多种知识表达方法 这些方法从技术上来说,大 致可以分成两大类:说明型方法和过程型方法 如谓词逻辑、 语义网络、 框架、 单元、 剧本和产生式系 统等均属于说明型表达方法,但其中有一些结合 了过程型的知识表达方法 在开发一种知识表达法时最大的问题是一种 两难的状态。
没有该领域的知识很难选择一种合适的知识表达法;没有把握它的定义表达很难获 得知识 为了解决这种两难的局面,必须采取直接 的措施:尽可能快地选择一种知识表达法,即使不 是最佳的(或最终的)表达法因为知识工程师必 须有某种方式来储存获取的知识如果没有明确地表达它,它会和专家一样很容易成为知识工程 师的潜在意识这在培养一个新的人类专家时是 可取的,而却无助于普通地获取知识 另一个在表达法选择中的主要问题是发生在 专家的知识和系统所描述知识之间的表达法失配的概率 失配的范围不断波动,由系统所依据的认 知模型(例如:反映专家实际执行任务的方式)或 功能模型(例如:利用不同的技术开发一个系统达 到与专家同样的结果)决定实际上,任何大型的 专家系统包括不同部分的两种类型的模型3. 6 核心问题的知识获取 样本问题最终要嵌入系统中,其它必需的软 件也要完成,这导致一个完整的示范原型 当决定 建立一个完整的系统后,知识工程师和专家确定 一系列核心问题,知识获取工作再次开始此时,知识工程师对该领域有了更深刻的了解,可以开 始更深入地钻研专家解决问题的过程,希望能找 到额外的细节和更全面的理由在核心问题实现 过程中,知识工程师能更加自信地对专家的陈述 提出问题并加以分析。
这种类型的分析是必须的,因为存在一些潜 在的陷阱可能影响专家以及系统 例如:像其他人 一样,专家有偏好同样,在该领域内专家可能在 某些方面没有最新的知识,所以应尽量避免之 还 有专家在判断时过于自信而且无法认识到知道和猜测的区别,他们也无法充分考虑边界条件或替 代的问题解决方式也许最严重的问题是专家无 法正确报告他实际解决问题的方式,这也许会丢 失一些启迪、 有价值的小窍门 这些问题可以通过利用多个专家来缓解将对问题的一些观点集中起来,既可以增强对现有 知识有效性的信心(最终专家完全同意)或确定现 在执行的错误概率(最终他们不同意)即使对多 个专家的利用(指在同一个领域中的专家),仍要43交 通 与 计 算 机 第17卷第17卷 第5期交 通 与 计 算 机VOL. 17 No. 51999年10月Computer and CommunicationsOctober. 1999收稿日期: 1999- 08- 19把从代表该领域不同部分的专家那里获得的知识 集合在一起在这个情况下的主要问题是理解和 表示整个系统知识有意义的是建立有多个专家 知识结构的专家系统。
4 知识获取最终目标如果说,知识工程师获取知识的最终目标是 建立一个专家系统是不够的知识获取的最终目 标应该是:专家对用于系统实现的技术比较熟悉,有拥有和成就感而知识工程师只是一个建立专 家系统的仆人,这样当基础系统完成的时候,专家 就可以直接升级和维护系统这种可能性是因为 系统结构已建立,专家已成为建立专家系统的内行,同时还有强大的知识基础编辑工具 最佳的状态是专家。












