好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

齐普夫定律的兴起.doc

2页
  • 卖家[上传人]:
  • 文档编号:42708334
  • 上传时间:2018-06-03
  • 文档格式:DOC
  • 文档大小:32KB
  • / 2 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 齐普夫定律的兴起、发展与启示齐普夫定律的兴起、发展与启示111180043 郭磊齐普夫定律是美国学者 G.K.齐普夫于本世纪 40 年代提出的词频分布定律后经朱斯、 芒戴尔伯特等人修正研究词频分布对编制词表,制定标引规则,进行词汇分析与控制, 分析作者著述特征具有一定意义经验表明,中频词往往是包含大量有检索意义的关键 词而一篇文献全文输入计算机后,计算机是很容易检出中频词的因此,词频分布也 是文献自动分类、自动标引的研究对象关键词:齐普夫定律 兴起 发展 启示一、兴起1935 年,齐普夫(George Kingsley Zipf,1902-1950)有关语言统计的著作出版[1], 这标志着一个新的语言学分支学科和一种新的研究方法的诞生在这本书的前言中,齐普 夫认为利用统计方法可以定量研究语言中的各种现象,这样语言学也可成为一门精确科学 这本书的标题“The Psyco-Biology of Language”(语言的心理生物学)表达了结合人类的 经验和功能来研究语言的意愿,书的副标题“An Introduction to Dynamic Philiology” (动态语文学)则强调了这种方法和其它方法的主要区别在于研究采用的是真实的语言样本, 语言应用的变化也会导致理论研究结论的变化,因此这是一种动态的语言学研究方法。

      1902 年 1 月 7 日,齐普夫 George Kingsley Zipf)出生在美国伊利诺伊州 Freeport 市 的一个德裔家庭1924 年,齐普夫以优异的成绩从哈佛大学毕业大学毕业后,他去德国 柏林大学和波恩大学求学三年在此期间,他开始有了把语言作为一种自然现象进行研究 的想法返回美国后,他于 1929 年在哈佛大学获得比较语文学博士学位,博士论文为《相 对频率作为语音变化的决定因素》(Relative Frequency as a Determinant of Phonetic Change)1930 年,开始在哈佛大学任教,从事德语教学工作1950 年因病去世,时年 48 岁Zipf 的代表性著作是《语言的心理生物学》(The psycho-biology of language. An introduction to dynamic philology, 1935)和《人类行为及最小用力原则》(Human behavior and the principle of least effort, 1949)除此之外,他还发表过 40 多篇 文章,内容大多和语言的计量研究有关。

      齐普夫在这些著作当中提出了许多创新的想法, 如:自组织的概念,语言经济性原则以及语言定律的基本特征等他的“最小用力原则” (principle of least effort)和“统一化力量与多样化力量”(forces of unification and diversification)的原理,直到今天对我们仍然是很有启发性的二、发展齐普夫定律可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频 词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的 词等级为 1,频次次之的等级为 2,……,频次最小的词等级为D若用 f 表示频次,r 表 示等级序号,则有 fr=C(C 为常数)后来,经过学者们的多次修正,这个定律有了更为精确的形式 艾思杜(J.Estoup)、贡东(E. Condon)、朱斯(M.Joos)、曼德尔布洛特(B.Mandelbrot) 以及齐普夫本人,先后对上述定律进行过研究,因而又称齐普夫定律为齐普夫—朱斯—曼 德尔布洛特定律(Zipf-Joos-Mandelbrot law)[2]修改后的齐普夫定律说明只要掌握一 种语言中的 1000 个最常用词,就有可能读懂该语言文章的 80%。

      这个事实对于语言教学以及自然语言信息处理都是十分重要的齐普夫之后,许多学者对不同语言的文本进行了实测,结果表明 γ 值会随语言的不同而 发生微小的变化最新研究表明,这种微小的差异也许可以作为语言分类的一种指标三、启示信息技术的发展,使文献检索功能越来越强大,对词频分布定律的深入理解有助于期刊编 辑工作的提升不同检索用词的查找结果可以直观地反映出各种词汇在学术文章中的使用频率,一本学 术期刊的作者和读者常常是来自相同的科研群体,更多地使用高频词,也就意味着更容易被 读者检索到,从而提高期刊文献的利用率同时,若对学术期刊一段时间内发表文章的关键 词或标题词词频加以统计分析,对进一步明确所发文章的研究热点和常用的技术手段会有帮 助;通过长期追踪, 对研究热点和常用技术手段的发展变化也将会有更深入的了解,这些都 会对有侧重地组稿和确定报导重点带来益处参考文献:《信息计量学》——邱均平《齐普夫定律与中文词频分布机理》 ——许文霞 《情报科学》《齐普夫定律的相关问题研究—贡东公式探由》——崔旭 邵力军 《现代情报》《齐普夫定律的汉语适用性及其在自动标引中的应用》——杨波 阎素兰 《情报理论与实践》《齐普夫定律》——《晋图学刊》《文献计量诸定律的统一性研究》——刘晓敏《郑州航空工业管理学院学报:管 理科学版》。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.