好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

语料库利用的两个问题课件.ppt

55页
  • 卖家[上传人]:夏日****8
  • 文档编号:329156565
  • 上传时间:2022-08-01
  • 文档格式:PPT
  • 文档大小:515KB
  • / 55 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 关于汉语作为第二语言教学研究中关于汉语作为第二语言教学研究中语料库利用的两个问题语料库利用的两个问题福建师范大学 沙平第1页,共55页一、语料库与语料库语言学1.1 语料库(语料库(corpus/corpora):):是存储语料的数据库,是以电子文本或其它电子介质形式存贮在计算机中的、借助计算机软件进行管理并可以通过计算机软件进行查询、检索、统计的一定数量的语言材料的集合,是进行语言研究的一种普遍资源第2页,共55页一、语料库与语料库语言学1.2 语料库语言学语料库语言学(corpus linguistics):包含两个方面:(1)语料库建设,包括对自然语料进行加工、标注;(2)语料库应用,用已经标注好的语料进行语言研究和应用开发是以现实生活中人们运用语言的实例为基础进行的语言研究,可以在研究中发现某些语言规律,也可以对语言假说进行验证第3页,共55页一、语料库与语料库语言学1.3 汉语中介语语料库建设汉语中介语语料库建设汉语中介语语料库的建设是在国内外语料库语言学和母语语料库建设的影响下开始的国外第一代计算机语料库(196070年代):小规模(百万词级),以语言研究为导向,词法级Brown、LOB、London-Lund Corpus。

      第4页,共55页一、语料库与语料库语言学第二代计算机语料库(1980年代):大规模(千万词级),词典编纂应用导向,句法级Bank of English、Longman、ICE(The International corpus of English)第5页,共55页一、语料库与语料库语言学第三代计算机语料库(1990年代):超大规模(上亿词级),标准编码体系深度标注/多语种NLP应用,语义和语用级BNC(The British National corpus)、LDC(Linguistic data Consortium,语言学资料共享计划)、法兰西语料库、俄语国家语料库、NERC(Network of European Reference Corpora,欧洲参考资料语料库网/欧洲语料库网(European Corpora Network)第6页,共55页一、语料库与语料库语言学第四代语料库:互联网作为语料库可以把不断发展的因特网作为虚拟语料库第7页,共55页一、语料库与语料库语言学中国大陆中国大陆的语料库建设的语料库建设:始于80 年代初期,发展迅速例如:“汉语词频统计语料库”为200万字次;“现代汉语语料库”为7000万字次;“中文五地区共时语料库”每年收入的语料达6亿至8亿多字次;“面向语言教学研究的汉语语料检索系统CCRL”为8亿多字次。

      第8页,共55页一、语料库与语料库语言学在这种背景下,从上世纪90年代开始,中国大陆开始建设外国人学习汉语的中介语语料库经过10多年的发展,汉语中介语语料库建设已初具规模,并在汉语作为第二语言教学与习得等研究领域发挥了重要的作用第9页,共55页一、语料库与语料库语言学1.4 已建成的主要汉语中介语语料库已建成的主要汉语中介语语料库北京语言大学:汉语中介语语料库系统(1995)、HSK动态作文语料库(2006)、首都外国留学生汉语文本语料库(2010)、汉语学习者口语语料库(2007)南京师范大学:外国学生汉语中介语偏误信息语料库中山大学:留学生中介语语料库暨南大学华文学院:留学生汉语中介语语料库第10页,共55页一、语料库与语料库语言学上海交通大学、厦门大学、北京大学、中国人民大学、北京师范大学、鲁东大学、苏州大学、四川外国语学院、华中师范大学等,也都已经建成或正在建设自己的汉语语料库但是,现有的语料库绝大多数都是书面语语料库,口语语料库很少,多模态语料库尚无建成者第11页,共55页一、语料库与语料库语言学 1.5 作用与成果作用与成果 通过对语料库中较大规模真实语料的考察,研究者发现了前人未曾发现的一些汉语中介语现象。

      语料库为定量分析奠定了坚实的基础,研究者可以把定性研究与定量研究相结合,从而使得出的研究结论具有较强的客观性、普遍性和科学性,这在一定程度上改变了汉语教学与习得研究的模式,极大地提高了汉语作为第二语言教学研究的水平第12页,共55页一、语料库与语料库语言学 研究案例一:关于汉语补语的习得难度与研究案例一:关于汉语补语的习得难度与习得顺序习得顺序 一般认为有复杂的补语系统是汉语语法的一个特点,也是外国学习者习得汉语的一个难点但是,北京语言大学的课题组利用“汉语中介语语料库”对带“得”字补语句的习得状况进行了考察,发现学习者习得“得”字补语句的偏误率没有人们想象的那么高见下表)第13页,共55页得”字程度补语句的习得状况形形 式式词词 次次正误比正误比 +得得+多多3228/4 +得得+很很1712/5 +得得+不得了不得了87/1 +得得+厉害厉害22/0 +得得+慌慌22/0 +得得+要命要命11/0 +得得+远远11/0第14页,共55页得”字情状补语句的习得状况一级一级二级二级三级三级四级四级五级五级六级六级合计合计正413140311922184误614764239 (孙德金2002,赵金铭 2008)第15页,共55页。

      一、语料库与语料库语言学这一研究结果促使研究者利用相同语料库对不带“得”字补语句(如趋向补语)的习得情况进行考察,结果发现学习者习得不带“得”字补语句偏误率整体高于带“得”补语句通过进一步的深入考察,研究者大体构拟出了英、日、韩(朝)等母语学习者对汉语不同类型补语的习得顺序杨德峰2003、2008)第16页,共55页一、语料库与语料库语言学 中国大陆近年来中国大陆近年来基于语料库的具有代表基于语料库的具有代表性的研究成果:性的研究成果:赵金铭教授:“基于中介语语料库的汉语句法研究”(2008)张博教授:“基于中介语语料库的汉语词汇专题研究”(2008)肖奚强教授:“外国学生汉语句式学习难度及分级排序研究”(2009)第17页,共55页二、关于语料库利用的两个问题2.1 利用语料库已经成为汉语作为第二语言利用语料库已经成为汉语作为第二语言教学研究的教学研究的主流方法主流方法语料库以其语料的充分性、客观性、可验证性、使用的便捷性,正在使语言学的研究与应用产生量与质的飞跃语料库语言学将数据收集与理论论述有机地结合在一起,使我们对语言的理解发生了质的变化.(Halliday1991)基于语料库的研究方法,已经成为当代语基于语料库的研究方法,已经成为当代语言学和应用语言学研究中的一种言学和应用语言学研究中的一种主流方法。

      主流方法王建新2005)第18页,共55页二、关于语料库利用的两个问题 语料库的使用,为语言学的研究提供了一种新的思维角度,辅助人们的语言“直觉”和“内省”判断,从而克服研究者本人的主观性和片面性,逐渐成为语言学研究的主流方法从某种意义上说,语料库的使用,是语言学研究语料库的使用,是语言学研究的一次革命性的进步的一次革命性的进步冯志伟2006:14)第19页,共55页二、关于语料库利用的两个问题 以北语开发的以北语开发的“HSK动态作文语料库动态作文语料库”为例为例 为海内外众多硕士生、博士生所使用,为他们的研究及论文写作提供帮助学术期刊、学术会议及网上可以看到众多利用该语料库的研究成果注册用户众多,一旦发生故障会引起全球性反应但是,我们发现在利用语料库进行汉语习得和教学的研究中,有两个问题值得我们有两个问题值得我们注意第20页,共55页二、关于语料库利用的两个问题2.2 要注意研究对象的要注意研究对象的“同质同质”性性 欧美现代语言学之父、瑞士语言学家费尔迪南德索绪尔索绪尔(ferdinand de saussure 1857-1913)十分重视语言研究的“同质”问题他提出了区分语言/言语、历时/共时、能指/所指、组合关系/聚合关系等一系列二分的语言学概念,就是为了确保语言研究对象和语言研究的同质性。

      第21页,共55页二、关于语料库利用的两个问题 研究案例二:关于汉语形容词的语法分布研究案例二:关于汉语形容词的语法分布 在英语中,修饰名词作定语是形容词的专利;但在汉语中,对形容词修饰名词作定语的语法功能却有着截然相反的论述,对形容词充当谓语也有不同的看法:第22页,共55页二、关于语料库利用的两个问题 “形容词能作谓语或谓语中心语和定语,多数能够直接修饰名词黄伯荣、廖序东主编现代汉语,高等教育出版社,2004年已发行500多万册)“在不带的的格式里,形容词和名词的配合受到限制,比如可以说白纸、白头发,但是不说或不太说白手、白家具朱德熙语法讲义,商务印书馆,1982年第23页,共55页二、关于语料库利用的两个问题 “性质形容词单独作谓语也有一定的限制,一般只能用于对照、比较的情况在没有比较意味的句子里,一般要在前面加上程度副词很刘月华等主编实用现代汉语语法,商务印书馆,2002年有学者利用语料库对汉语形容词在书面语和口语中的分布进行了统计(张宝林2011):第24页,共55页二、关于语料库利用的两个问题 形容词的主要语法功能:定语说形容词的主要语法功能:定语说+谓语说语料语料形容词形容词谓语谓语频率频率定语定语频率频率口语50429859.1%10821.4%书面语61110717.5%38563.0%口+书111540536.3%49344.2%第25页,共55页。

      二、关于语料库利用的两个问题 口语和书面语是不同质的研究对象,基本义相同的口语词和书面语词经常不能替换:如“帮”、“帮助”、“帮忙”基本意义相同,“你帮我买张票”,不说“帮助”和“帮忙”;“他欺骗我的感情”、“他骗我的钱”,“欺骗”和“骗”也不能互换这和书面语与口语有关,也和汉语的节律有关结论:对汉语形容词语法分布的论述应区分结论:对汉语形容词语法分布的论述应区分口语体与书面语体口语体与书面语体第26页,共55页二、关于语料库利用的两个问题研究案例三:研究案例三:“把把”字句习得的字句习得的“回避回避”说说与与“不回避不回避”说说量词的用法、形容词谓语句、无标记的被动句、带各种补语的句子、“把把”字句(多数学生难点中的难字句(多数学生难点中的难点点)、“了”“着”“过”的用法(“了”也是难点中的难点)、比较句、方位词的用法、长定语、三位数以上的大数目怎么知道什么是难点,什么不是难点呢?一是通过语言语言对比对比研究来发现,二是靠教学经验到底什么到底什么是真正的难点,最终还要靠教学经验来检验是真正的难点,最终还要靠教学经验来检验吕必松1992:110)第27页,共55页二、关于语料库利用的两个问题如以英语为母语的学习者的语法难点有:形容词谓语句、无标记被动句、带各种补语的句子、“把把”字句字句、“是的”句、比较句以及“了”“着”“过”的用法、量词用法、方位词用法、长定语、大数目称数法以及话语连接等。

      其中的大部分,对任何母语背景的学习者来说也都是难点通过语言对比突出语法的重点和难点通过语言对比突出语法的重点和难点对外汉语语法教学的一大特点是学习者会受到其第一语言迁移作用的影响作为第二语言的汉语对所有学习者都有共同的难点,对不同母语背景的学习者又有特殊的难点刘珣2000:366)第28页,共55页二、关于语料库利用的两个问题对欧美学生来说,受事主语句、存现句、主谓谓语句,以及时间、地点状语的位置,始终是学习的难点,同时也体现汉语语法特点而带有普遍性的语法难点,则是“把把”字字句句、各类补语以及时态助词“了”“着”等至于我们所认为的特殊句式,其实并并非非学学习习的的难难点点,比如连动句、兼语句、“是”字句、“有”字句以及名词谓语句、形形容容词词谓谓语语句句这这也也是是从从多多年年教教学学中体味出的中体味出的赵金铭 2006)第29页,共55页二、关于语料库利用的两个问题学界共识:1)最大难点:“多数学生难点中的难点”。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.