词和词组的分布特征分析_纪念高名凯先生诞辰100周年(期刊版).pdf
38页词和词组的分布特征分析 ----纪念高名凯先生诞辰100周年 陈保亚 北京大学中国语言学研究中心 北京大学中文系 cbyhf@ 20110327 提要 • 高名凯先生反对根据词的语法功能给词 分类,他看到了词的多种可能本文尝试 提取几个最初始的分布特征,在此基础上 给词作分布标注,推导词组的分布特征和 句法关系最后认为,高名凯对词类功能 (分布)重要性的认识是上个世纪词类研 究乃至整个语法理论研究中最重要的方法 论进展之一 高名凯和朱德熙词类观的统一与分歧 •我个人认为,上个世纪五、六十年代高名凯和朱德熙关于汉语 词类的争论代表了二十世纪词类观念中态度最鲜明也是最清晰的两种思路两种思路有统一也有分歧 •统一到两点: •1,分类只能根据可观察形式,不能根据意义 •2,汉语没有严格意义的形态汉语词的分布位置不是单一的 •关键分歧: •高名凯:分布(功能)复杂多变形态是划分词类的唯一依据汉语没有形态,汉语没有词类 •朱德熙:所有的语言最终都必须根据分布来分词类,包括有形态的语言汉语词的分布有一定的规律,可以分类 朱德熙先生词类理论中遗留的问题 • 朱先生的分布包括两种情况: • 句子成分中的分布 • 鉴定字框架中的分布 成分分布遇到的问题 • 汉语普通话中比较明确的结构关系主要有 偏正结构标记和述补结构标记: • 认真de调查 • 厉害de很 循环论证问题 • 主谓关系和述宾关系一般没有标记。
很多情况下,偏正 结构的标记和述补结构的标记也不出现因此判定下面的结构关系需要依据词类: • 下午有可(前项为名词) • 经常有课(前项为副词) • 写清楚(后项为形容词) • 写小说(后项为名词) • 这样就出现了循环本来是要通过词在句子成分环境中的分布来归纳词类,但却预先利用到词类的概念 体系问题 • 下面的词组,由于体系不同,结构关系有 不同理解: • 下午有课(主谓或状中) • 走三天(述宾或述补) • 这些结构关系常常用来描述词的分布,出 现分歧 鉴定字环境存在的疑点 • 目前的鉴定字方法是根据心目中暗含的分 类来找鉴定字 • 比如,通常的做法是首先根据“不”在实 词中区分谓词和体词为什么不用“个”? 显然已经先有了谓词和体词的分野为什 么不用“了”?因为“不”最能概括谓词 和体词这一既定的分野 陈述与指称 • 朱德熙先生进一步为谓词和体词的区分找 根据,提出陈述和指称 • 那么陈述和指称的判定标准是什么?如果 是鉴定字“不”,“雪白”算不算陈述? 再看形态和功能 • 朱德熙先生认为分类的根本依据是功能 (即分布),即使有形态的语言也是如此 这是一个重要的发现不过,几十年过去 了,汉语词类划分仍然没有达成共识,说 明从功能划分词类确实很复杂。
高名凯在 《汉语语法论》(1948)中其实是主张可 以根据词的语法功能和结合能力(广义形 态)划分词类的,五、六十年代开始反对 根据语法功能划分词类,应该说他已经看 到了根据功能分类的复杂性 问题的关键 • 尽管形态归类也必须依靠功能,但有形态 的语言中,相同形态的词分布是比较整齐 的 • 朱德熙先生主张根据功能给词分类,他注 意的是分布的规则性一面,比如有些词主 要作主语、宾语,有些词不仅作主语、宾 语,还可以做谓语但还有不少词,分布 是很特殊的 实例分析 • 胜利归来(动词作状语) • 历史de看问题(名词加de作状语) 高名凯先生对分布的认识 • 高名凯先生(1954,P283)已经提到,要有词 类的分别,就必须标注 • 高是承认不同的词有不同的功能(1955.1, P298),甚至一个词只有一种功能,但坚持不 用这种功能分类 • 高名凯的词类功能,就是分布 分类的基本原则:有效组合与类推 •主张分类的学者大多数认为分类的目的是为了语法研究具体指什么研究目前还没有一个统一的解释我个人认为,分类必须满足语类的组合条件和推导性 •一个有效的语类组合推导模型应该满足三个目标: •X类词和Y类词能否组合 •XY词组属于什么语类 •XY之间有什么组合关系 •比如: •N+N=NP(桌子椅子/学生家长) •A+N=AP(大苹果) •V+N=VP/NP (烤红薯) •分类不是任意的。
分类必须满足语类的组合与推导因此分类不应该漫无边际的细化以至于没有概括性,也不应该太粗以至于无法推导词组的语类,比如上面的V+N有两种结构关系和 分布,需要细分词类 特征组合推导模型 • 语类组合推导模型必须从词类出发来确定组合条件和词 组的语类和结构关系高名凯先生认为汉语没有词类,如何解决语类组合推导模型需要解决的问题? • 我们可以考虑一个分布特征组合推导模型,这样的模型也需要满足三个目标: • 具有分布特征A的词X和具有分布特征B的词Y能否组合 • XY词组的分布特征是什么 • XY之间的结构关系是什么 • 下面我们来看看特征组合推导模型可以发展到什么地步 初始分布特征:谓述与指称 • 朱先生上个世纪80年代初提出了陈述和指称的观点 前面提到,这个观点有两个问题需要解决: • 1,为什么把陈述和指称作为词类划分的重要的基 础 • 2,如何判定陈述和指称 • 朱先生的陈述和指称跟逻辑学和哲学中的一些初始 概念有关系下面我们从这个角度开始展开 言有所为 • 词组在言谈、运思活动中的分布是不一样的: • 便宜土豆(一斤/便宜土豆;*不/便宜土豆) • 土豆便宜(土豆不便宜;*一斤/土豆便宜) • 买土豆(不/买土豆;*一斤/买土豆) • 烤土豆(不/烤土豆;一斤/烤土豆) • 如何判定词组在分布上的差别,是交际或运思必须 要面临的问题。
我们需要从词的分布规律找出词组的分布规律,这就是分布或词类初始性的体现 真值的重要性 •在逻辑学中,凡命题(proposition)都是有真值的比较: •老师了解学生 •老师不了解学生 •在逻辑学中,命题是推理的基本单位在语言学中,句子是交际和运思的基本单 位命题最本质的特征就是要有真值,体现在语言中就是肯定和否定 逻辑学逻辑学 语言学语言学 概念概念 词 命题命题 句子 推理推理 句群、语篇 肯定与否定 • 交际和运思要有命题句才能充分展开命 题句通过有条件的变形可以进一步形成祈 使句、疑问句、感叹句等形式判定哪些 是命题句就成了首要任务肯定和否定是 判定有真值的命题句的最重要的方式 • 命题有真假两种取值,在句子中体现为肯 定和否定 否定的承载 • 在有真值的简单否定句中,只有某些词能独立 承载否定 • 老师不了解学生----不了解 • 学生不理解老师----不理解 • 这说明有些词是判定一个句子能否获得真值的 关键由此我们为朱德熙先生关于陈述和指称 的区分找出了一个依据 陈述特征的主要判定方式:否定 •于是分布特征可以首先分出谓述特征(陈述特征)和指称特征 在能够独立成句的词中,即一般所谓的实词中,能独立承载否定形式的词具有谓述特征,否则只有指称特征。
•承载否定形式的主要格式: •不去 (不A) •去不去(A不A) •没去(没A) •A没A(A没A) •主张汉语必须划分词类的学者通常根据“不”划分谓词和体词,从这里的分析看是有根据的 •(特殊处理:非人) 谓述特征的系连 • 一般地说,由于有些词已经自带了一定的量或某种限定, 如“冰凉、漆黑”,再否定的话在语义上不太协调,但可以通过系连的方式来判定是否有谓述特征 • 借助建立在真值上的谓述特征,可以判定核心词以及大量基本词是否带有谓述 • 有些连接词框架只允许带谓述特征的词或词组出现: • • 不但天气热,而且空气潮湿 • • 这些命题的连接还可以还原到具有谓述特征的词: • • 不但热,而且潮湿 • 有了谓述连接词我们可以通过系连的方式由 已知谓述词断定其他谓述词: • • 不但窄,而且漆黑 • 不但糊涂,而且叽叽喳喳 • 不但干净,而且雪白 • • 于是“漆黑、雪白、透亮、飞快”等都能够判 定为具有谓述特征的词 更多分布特征的提取 • 特征组合推导原则: • 相同的分布特征组合只能推导出相同的结 构分布特征和结构关系 • 如果不满足这个条件,就还需要提取更多 的特征 支配、体饰与谓饰(1) • 大红薯 • 买红薯 • 烤红薯(不烤红薯/三个烤红薯) • • 从成分的分布特征看,前一个成分有谓述特征, 后一个成分有指称特征,但整个词组可以有两种特征,谓述特征和指称特征。
• 要有效地完成特征组合推导,还需要从谓述特征中独立出修饰特征、支配特征 支配、体饰与谓饰(2) • 如果考虑非独立词,分布特征还要增加比较: • • 经常工作(不经常工作) • 局部工作(*不局部工作) • • “经常工作”有谓述特征,“主要工作”没有谓述 特征,这两者的差别在于“经常”和“局部”,可 见修饰特征要分成两种,一种是谓饰特征,一种是 体饰特征郭锐(2002)从表述功能上分出体饰和 谓饰,从这里的特征组合推导上可以找到依据 引介特征 • 比较: • 从北京 • 去北京 • “从北京”有谓饰特征,“去北京”有谓述特 征如果支配特征不分成两种,则不能充分区 别这里的特征推导于是我们再提取一个引介 特征 提取特征的限度 • 以上在不考虑结构标记的情况下,提取了 几个基本分布特征要全面描写组合规则 和推导规则,需要提取更多的基本分布特 征只要达到组合推导目的,特征的提取 就终止剩下的组合规则应该是语义上的, 比如“吃鸡、喝水”的选择限制 基于组合推导的分布特征标注举例 • 以上部分词的分布特征标注为: • 大:谓述、体饰、谓饰(大干一场) • 买:谓述、支配 • 烤:谓述、体饰、支配 • 经常:谓饰 • 局部:体饰、 • 从:引介 • 工作:谓述、指称、体饰 • 胜利:谓饰、谓述、指称、体饰 • (如何实词都可以作主语或话题,不作分布特征提取) 特征组合推导表 前项分布特征前项分布特征 后项分布特征后项分布特征 实例实例 结构分布特征结构分布特征 结构关系结构关系 体饰体饰 指称 大苹果/恶性肿瘤 指称 定中 支配支配 指称 买苹果 谓述 述宾 谓饰谓饰 谓述 经常工作 谓述 状中 指称指称 谓述 苹果大 谓述 主谓 引介引介 指称 把苹果 谓饰 介宾 分布歧义 • 如果前后两项所含的分布特征有两种或两 种以上的可组合性,词组的分布和内部结 构关系就有歧义: • 烤白薯 体饰体饰 指称指称 大苹果大苹果 指称指称 定中定中 支配支配 指称 买苹果 谓述 述宾 两种模型的比较 • 特征组合推导模型需要提取基本分布特征并给 每个词标注有哪些分布特征。
• 语类组合推导模型要借助词类,在词类划分的 时候,哪个词归哪个类,也必须要获得该词的 详细分布特征信息,而且还要进一步分类在 词组中,还要检查两个词之间可能有哪些分布 特征可以组合(烤白薯)由此可见,语类组 合推导模型比特征组合推导模型多一项工作, 而且这项工作是高度复杂的,体现在100年来 汉语词类划分的各种方案和争论中 划分词类的难点 • 划分词类的困难不在于一个词有很多种分布特征,而在于分布特征不整齐比如谓述词: • 如果有大量词都只有谓述、支配特征,分类就容易,否则就要考察和处理不一致分布的情况 吃吃 谓述谓述 支配支配 买买 谓述 支配 写写 谓述 支配 研究研究 谓述 支配 体饰 指称 区别区别 谓述 支配 体饰 指称 谓饰 姓姓 谓述 支配 指称 分类的价值 • 如果分布整齐,就有利于分类 • 一旦获得了内部成员分布整齐的词类,在标注 上就可以简化比如,我们可以在语法手册中详细描述区别词的分布特征: • 区别词:体饰特征;----的 • 在词库中,我们只需要标注某个词为“区别 词”,就提供了足。

卡西欧5800p使用说明书资料.ppt
锂金属电池界面稳定化-全面剖析.docx
SG3525斩控式单相交流调压电路设计要点.doc
话剧《枕头人》剧本.docx
重视家风建设全面从严治党治家应成为领导干部必修课PPT模板.pptx
黄渤海区拖网渔具综合调查分析.docx
2024年一级造价工程师考试《建设工程技术与计量(交通运输工程)-公路篇》真题及答案.docx
【课件】Unit+3+Reading+and+Thinking公开课课件人教版(2019)必修第一册.pptx
嵌入式软件开发流程566841551.doc
生命密码PPT课件.ppt
爱与责任-师德之魂.ppt
制冷空调装置自动控制技术讲义.ppt


