电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

人工智能第8章__自然语言理解

29页
  • 卖家[上传人]:给****
  • 文档编号:55912261
  • 上传时间:2018-10-08
  • 文档格式:PPT
  • 文档大小:289.50KB
  • / 29 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、1,第8章 自然语言理解,8.1 语言及其理解的基本概念 8.2 词法分析 8.3 语法分析 8.4 语义分析,自然语言是指人类日常交流所使用的语言。自然语言理解主要研究如何使计算机能够理解和生成自然语言。自然语言理解既是人工智能研究较早的一个领域,同时也是现代计算机的一个必备特征。,2,8.1 语言及其理解的基本概念,自然语言是音义结合的词汇和语法体系。词汇是语言的基本单位,它在语法的支配下可构成有意义和可理解的句子,句子再按一定的形式构成篇章等。其结构如图8.1所示:,语言,词汇,语法,词,熟语,词法,句法,词素,构形法,构词法,词组构造法,造句法,词汇是语言的基本单位。熟语是指一些词的固定组合,如汉语中的成语。词又由词素构成,词素是构成词的最小有意义的单位。如“学生”是由“学”和“生”这两个词素构成的。 语法是语言的组织规律。词法是用词素或熟语构成词的规则,可分为构形法和构词法。构形法是指单数复数等。造句法是用词和词组构造句子的规则。,语言,词汇,语法,词,熟语,词法,词素,句法,构形法,构词法,词组构造法,语言,词汇,语法,词,熟语,词法,词素,3,其主要任务是要找出词汇的各个

      2、词素,从中获得语言学信息,并确定单词的词义。以英语为例,其词法分析的基本算法如下:repeatlook for word in dictionaryif not foundthen modify the worduntil word is found or no further modification possible 其中,word是一个变量,其初始值就是当前词。例8.1 用上述算法分析catches。解:其分析过程如下:catches 词典中查不到catche 修改1:去掉scatch 修改2:去掉e可以看出,在修改2时就查到了catch。当然,这只是一个很简单的例子,完整的词法分析还应该包括复合词的切分等。,8.2 词法分析,4,8.3 句法分析,句法分析:一是对句子和短语的结构进行分析,目的是要找出词、短语等的相互关系,以及他们在句子中的作用等,并用一种层次结构加以表达;二是对句法结构规范化,对一个句子分析各个成分间的关系的推导过程用树形图表示,这种图称为句法分析树。,8.3.1 短语结构语法 8.3.2 乔姆斯基形式语法 8.3.3 句法分析树 8.3.4 转移网络 8.3

      3、.5 扩充转移网络,8.3.1 短语结构语法,短语结构语法和乔姆斯基语法是描述自然语言和程序设计语言强有力的形式化工具,可用于在计算机上对被分析的句子的形式化描述和分析。 短语结构语法G的形式化定义:G =(T ,N ,S ,P) 式子中,T是终结符的集合,N是非终结符的集合, 显然T和N不相交,T和N共同组成了符号集V,因此有:V =TN, TN =空集;S是起始符,它是集合N的一个成员;P是产生式规则集,形式如下:ab 由一部短语结构语法定义的语言L(G)就是可以从起始符S推导出的符号串W的集合。即一个符号串属于L(G)必须满足:(1)该符号串只包含终结符;(2)该符号串能根据语法G从起始符S推导出来。,例8.1 the/a man killed the/a deer the/a man like the/a deerThe/A man like the/a deer. 经词法分析得到上面类型的符合语法G详见转移网络语法。,8.3.2 乔姆斯基形式语法,根据形式语法中所使用的规则集,乔姆斯基定义了4种类型的语法: (1)无约束短语结构语法,又称0型语法; (2)上下文有关语法,又称

      4、1型语法; (3)上下文无关语法,又称2型语法; (4)正则语法,又称3型语法;型号越高所受约束越多,生成能力月若,能生成的语言集越小,也就是说它的描述能力越弱。ATN就是基于上下文无关思想实现的一直自然语言句法分析技术。正则语法又称有限状态语法,只能生成非常简单的句子。有2种形式:左线型语法和右线型语法。,8,上下文无关文法(Context-free Grammars)是乔姆斯基提出的一种对自然语言语法知识进行形式化描述的方法。在这种文法中,语法知识是用重写规则表示的。作为例子,下面给出了一个英语的很小的子集(图8.4)。语句 句子 终标符句子 名词短语 动词短语动词短语 动词 名词短语名词短语 冠词 名词名词短语 专用名词冠词 the名词 professor动词 wrote名词 book动词 trains专用名词 Jack终标符 . . 这就是一个英语子集的上下文无关文法在该文法中,“语句”是一个特殊的非终极符,称为起始符。,8.3.2 句法规则的表示方法 上下文无关文法(1/2),9,8.3.2 句法规则的表示方法 上下文无关文法(2/2),例8.2 利用上述上下文无关文法,给出

      5、如下语句的分析树。The professor trains Jack.,语句,句子,终标符,动词短语,名词短语,The,professor,.,trains,冠词,名词,动词,专用名词,名词短语,Jack,解:如图8.5,10,8.3.3 句法分析树,一个句子是由各种不同的句子成分组成的。这些成分可以是单词、词组或从句。句子成分还可以按其作用分为主语、谓语、宾语、宾语补语、定语、状语、表语等。这种关系可用一棵树来表示,如对句子:He wrote a book 可用图8.2所示的树形结构来表示一个句子又是由若干个词类构成的,如名词、动词、代词、形容词等。若从句子的词类来考虑,一个句子也可用一棵树来表示,这种树称为句子的分析树,如图8.3所示。,8.3.4 转移网络,转移网络在自动机理论中用来表示语法。句法分析中的转移网络有借点和带有标记的弧组成,节点表示状态,弧对应于符号,基于该符号,可以实现从一个给定的状态转移到另一个状态。 The man laughed,8.3.5 扩充转移网络,13,8.3.N 句法规则的表示方法 变换文法(1/2),上下文无关文法反映的仅是一个句子本身的层次结构

      6、和生成过程,而自然语言是上下文有关的。为此,乔姆斯基又提出了变换文法(Transformational Grammar)。该文法认为,句子的结构有深层和表层两个层次。例如:She read me a story 和 She read a story to me 的表层结构不一样,但它们的深层结构则是一样的。再如,主动句和被动句也只是表层结构不同,其深层结构则是相同的。在变换文法中,句子深层结构和表层结构之间的变换是通过变换规则实现的,如图8.6给出了一条把主动句变换为被动句的变换规则。,句子,介词短语1,句子,名词短语1,动词短语,动词,名词短语2,名词短语2,动词被动语态,14,8.3.N 句法规则的表示方法 变换文法(2/2),助动词,介词,动词的过去分词,名词短语1,句子,介词短语,句子,名词短语1,动词短语,动词,名词短语2,名词短语2,动词被动语态,冠词,名词,专用名词,上下文无 关文法,变换规则,冠词,名词,The,professor,Jack,trains,Jack,专用名词,is,trained,by,the,professor,professor,例8.3 利用变换文

      7、法,将前述主动句变为被动句。解:其变换过程是:先从非终极符“句子”开始产生一个主动句:The professor trains Jack 然后再应用图8.6所示的变换规则把它变为被动句(图8.6) :Jack is trained by the professor,动词,冠词,名词,The,professor,名词短语2,专用名词,trains,动词,冠词,名词,The,professor,Jack,名词短语2,专用名词,trains,动词,冠词,名词,The,professor,15,8.3.N 自顶向下与自底向上分析 自顶向下分析法,自顶向下分析,是指从起始符开始应用文法规则,一层一层地向下产生分析树的各个分支,直至生成与输入语句相匹配的完整的句子结构为止。例如,图8-4所示的上下文无关文法,采用自顶向下分析方法对语句:The professor trains Jack . 进行分析的过程是:首先从起始符“语句”开始,正向运用规则:语句 句子 终标符 把分析树的根节点“语句”替换为它的两个子节点“句子”和“终标符”。然后再对新生成的节点“句子”使用规则:句子 名词短语 动词短语 将

      8、其替换为两个子节点“名词短语”与“动词短语”。对于“名词短语”,有两条规则可用,若按规则的排列顺序,则选用名词短语 冠词 名词 将“名词短语”被替换为“冠词”和“名词”,生成两个新节点。对“冠词”使用规则:冠词 The 对名词使用规则:名词 professor 以此进行,得到如图8.8所示的自顶向下的分析树(略)。,16,8.3.N 自顶向下与自底向上分析 自底向上分析法,自底向上分析,是以输入语句的单词为基础,首先按重写规则的箭头指向,反方向使用那些最具体的重写规则,把单词归并成较大的结构成分,如短语等,然后对这些成分继续逆向使用规则,直到分析树的根节点为止。仍以语句The professor trains Jack 为例,逆向使用图8.4中的那些具体规则后,可得到图8.9所示的 部分分析树。继续逆向使用规则,一步步归并,直到根节点“语句”为止,最后即可生成如图8.5所示的完整的分析树。自顶向下分析方法与自底向上分析方法虽然思路清晰,但分析效率不高。为了提高分析效率,可采用自顶向下与自底向上相结合的分析方法。,Jack,名词短语,专用名词,trains,动词,冠词,名词,The,pr

      9、ofessor,终标符,.,17,8.4 句义分析,语义分析就是要识别一句话所表达的实际意义。即弄清楚“干什么了”,“谁干的”,“这个行为的原因和结果是什么”以及“这个行为发生的时间、地点及其所用的工具或方法”等。语义文法是将文法知识和语义知识组合起来,以统一的方式定义为文法规则集。语义问法是上下文无关的,形态上与面向自然语言的常见文法相同,只是不采用NP、VP、PP等表示句法成分的非终止符,而是使用能表示语义类型的符号,从而可以定义包含语义信息的文法规则。格文法由费尔蒙提出,主要是为了找抽动词和跟它处在结构关系中的名词的语义关系,同时也扩及动词或动词短语与其他的各种名词短语之间的关系。也就是说,格文法的特点是允许以动词为中心构造分析结果。,8.4.1 语义文法8.4.2 格文法,18,8.4.1 语义文法,语义文法是在上下文无关文法的基础上,将“名词短语”、“动词短语”、“名词”等这些不含有语义信息的纯语法类别,用所讨论领域的专门信息,像“山”、“水”、“动物”、等这些具有很强语义约束的语义类别来代替。利用语义文法进行语义分析,就可以排除像“论文收到教授”这类无意义的句子。例如,下面是一个关于舰船信息的语义文法的例子:S PRESENT the ATTRIBUTE of SHIPPRESENT what is | can you tell meATTRIBUTE length | classSHIP the SHIPNAME | CLASSNAME class shipSHIPNAME Huanghe | ChangjiangCLASSNAME carrier | submarine在上述重写规则中,用大写英文字母的单词表示非终极符,小写英文字母表示终极符,竖线表示“或”的意思。利用上述语义文法进行语义分析,可以从语义上识别以下的输入:what is the length of the Huanghe?Can you tell me the class of the Changjiang?,

      《人工智能第8章__自然语言理解》由会员给****分享,可在线阅读,更多相关《人工智能第8章__自然语言理解》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结 2022年家长会心得体会集合15篇
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.