
AntConc的详细使用说明[整理].pdf
9页精品文档可编辑版 AntConc3.2.0 的使用说明的使用说明 1 1. 提取语境共现提取语境共现 1.1 设置检索项设置检索项 ((1)单项检索)单项检索 a)点击 file 下拉菜单中的“open files” ,选择要打开的语料(如果想打开整个文件夹, 可以选择 open directory) ; b)在“Search Term”一栏键入要检索的词项,如 go; c)在“Search Window Size” 一栏设置每一共现行出现的词数; d)点击,开始检索 检索结果如图 1.1 所示: 图 1.1 单项检索结果 ((2)多项检索)多项检索 设置多项检索 除了检索单个词项以外,AntConc 还具有检索多个词项的功能,检索方法为在检 索项间键入“|”符号 例:要检索动词 go 的各种时态形式,可在“Search Term”中输入 go|went|gone|goes 设置语境词检索 为了限制语境共现的检索,可以设定一个语境词在检索项周边一定 的语境范围内出现 例:如要研究 a of 这一类词组,可通过 AntConc 提取所有的词项, 检索方法如下: a)在“Search Term”一栏键入 a; b)点击“Search Term”旁的,进入“Advanced Search”界面, 如图 1.2 所示。
点击“Use context words and horizons” ,然后在“Context Words”一栏键入 of,点击如要重新设置语境词,可先点击 1 此说明书由华南师范大学外文学院 2007 研究生张杏娟编写,导师何安平订正和补充 其中限定范围的检索方法由香港城市大学 D.Lee 博士提供,仅此致谢 图 1.2 Advanced Search 界面 1 / 9 精品文档可编辑版 清除原来语境词,后重复以上操作另外,还需设定语境词距离检索项的位置, 如本研究中,of 在 a 的右二位置,所以“Content Horizon”确定为, 最后点击; c)回到语境共现的界面后,点击,开始检索结果可提取 a lot of, a bit of 等 词块 设置多字语检索 在研究中,如需检索多个词项,除了使用“”以外,也可使用以下方法,尤其 适合检索项数目较多的情况 例:研究感官动词 watch, sound, feel, hear, smell a)在 TXT 文本中键入所有要检索的词项,可多达 250 个词然后为该文本起名保存 需注意:键入的词项需以列的形式排列如: feel feels felt b)点击 Search Term 旁的,选择“Use search term(s) from list below” 。
点击 ,在保存以上新建的文本的盘符路径点击文本名,然后点击; c)回到语境共现的界面后,点击,开始检索 ((3)类别检索)类别检索 使用通配符检索 符号意义检索项检索结果 book*提取所有以 book 打头 的词,如 book、books、booking 、bookshop 等 *book提取所有以 book 结尾 的词,如 book、notebook 等 *零个或多个字符 *book*可以同时提取包括以上 两类词 +零个或一个字符book+提取所有以 book 打头 的词,但之后有零个或 一个字母,如 book、books ?任意一个字符?ough提取所有以字母组合 ough 结尾的,但之前有 一个字母的词,如 cough、rough 等 2 / 9 精品文档可编辑版 零个或一个词thinkof提取所有含有的词组, 如 think of、think highly of 等 #任意一个词look#提取所有与 look 的搭配, 如 look after、look at 等 附码检索 因研究需要,有些语料经过整理加工并附加上各种符号标记,称为“附码语料库” 如附有词性标注的LOBTAG和附有错误类型标记的CLEC等。
检索时只需键入某个标记 符号便可提取带附有该标码的所有词 例:提取LOBTAG语料库中所有的名词,只需键入*_NN(NN 为名词标码,关于其他 词性的详细标记,请参阅何安平,2004, 语料库语言学与英语教学一书的附录 113 页 ((4 4)在指定范围内检索)在指定范围内检索 a)a) 在 concordance 的检索界面上选择Regex (regular expression),键入.* 为检索项便可提取语料库中所有在起止符号“”和“”之间的所有文字内容,其他 符号照似类推 b) 在 concordance 的检索界面上选择Regex (regular expression),键入 .*write.* 为检索项便可提取语料库中所有在起止符号“”和“”之内的 “write”的语境共现行,其他词项照似类推键入的检索项计较大小写,但是可以用 通配符* 1.2 分析检索结果分析检索结果 ((1)观察频数、分布)观察频数、分布 频数即该检索项出现的次数,可在“Concordance Hits”一栏中获得 点击,查看检索项在语料文本中的分布状况 ((2)凸显周边语境词)凸显周边语境词 为了具体某个教学等目的,可通过凸显检索项周边的某些 词汇。
方法是选择“Kwic Sort” , R1 和 L1 分别代表检索项右 方和左方的第一个词,一次可设置三列凸现词,均按字母顺序 排列检索结果如图 1.3 所示如想使凸显内容的颜色一致,可 通过设置下拉菜单中的“Color Settings”改变颜色 另外,若要凸显的部分不是一个词,而是单词中的字母,可选择下拉菜单 中的“Concordance”选项中的“Sort by characters instead of words” ,如图 1.4 所示 图 1.4 Tool Preferences 下拉菜单界面 3 / 9 精品文档可编辑版 图 1.3 凸显周边语境词检索结果 ((3)提取搭配词表)提取搭配词表 通过点击主界面中的,可获得检索项的搭配词表,同时可以设置搭配词 的位置、出现的最少次数与词表的排列方式 例:观察 look 右一的搭配词 a)点击主界面中的; b)在“Search Term”一栏键入 look; c)设置搭配词的位置,如; d)点击,开始检索,检索结果如图 1.5 所示 e)点击“Sort by Freq” 可根据不同的需要设定搭配词表的排列方式,如按频数排, 按拼写字母排等等。
4 / 9 精品文档可编辑版 图 1.5 提取搭配词表检索结果 ((4)提取搭配短语)提取搭配短语 另外,也可以使用这一 工具来提取搭配词块,且可设置检索 项在词块中的位置 例:检索以 ask 开头的搭配词块 a)点击主界面中的; b)在“Search Term”一栏键入 ask; c)设置检索项的位置,如选择“On the left” ; d)设置搭配词块的长度,如 Min.Size:3, Max.Size:3; e)点击,开始检索,检索结果如图 1.6 所示,所有的 ask 被列在词块的左边 ((5)隐藏、分类和删除)隐藏、分类和删除 “隐藏”是指把检索结果中的检索项挖空,可用于教学或测试具体操作方法如 下: a)在“Search Term”一栏键入要检索的词项,如 look; b)点击,选择“Concordance” ,再选择“Hide search term in KWIC display” , 最后点击; c)点击,开始检索 检索结果如下: you always do your own homework? Do you ******* for help when you think it necessary? Do you help 图 1.6 提取搭配短语检索结果 5 / 9 精品文档可编辑版 2. 提取词频表提取词频表 2.1 单字和单字和 N 字语词频表字语词频表 单字词频表单字词频表是指目标语料库的单词表,且词频表的检索结果是以每个词的形式及 其频数排列。
方法如下: a)选择要生成单字词频的目标语料库; b)进入界面,设置词频表排列排序方式,如“Sort by Freq” ;也可以设置为 按词头的或者词尾的拼写字母顺序排列 c)点击,开始检索,检索结果如图 2.1 所示 图 2.1 单字词频表检索结果 N 字语词频表字语词频表是指目标语料库的多字语频数表例如,检索句子“This is a pen” 的 2 字语词频表结果为:“this is” 、 “is a” 、 “a pen” N 字语词频表的提取方法如下: a)选择要生成单字词频的目标语料库; b)进入界面,后点击; c)设置 N 字语词频表的长度,如 d)选择词表的排序方式,如“Sort by Freq” ; e)点击,开始检索,检索结果如图 2.2 所示 6 / 9 精品文档可编辑版 图 2.2 N 字语词频表检索结果 2.2 词项重组词项重组---词簇化(词簇化(lemmatizing)) 词簇化是将同一词性的某个词的所有曲折变化形式作削尾处理,并归为一个词簇来 计算频数其好处是可以简约词频表并且引起对构词法的关注对词频表进行词簇化 的方法如下: 在界面生成词频表之后,拉下 Tool Preference 菜单,选择 Lemma list options, 点击 open 和 load,上传 lemma1 文档(可在本网站下载)点击 Apply (如图 2. 3 所示) 。
词簇化的部分结果见图 2.4. 图 2. 3 设置词簇化界面 7 / 9 精品文档可编辑版 图 2.4 词频表被词簇化后的结果(部分) 图中 1142 例 a 和 133 例 an 被归为同一个词簇 a 共 1275 例 3. 提取关键词表提取关键词表 关键词表是指两个语料库的词频表相比,其中一个明显地高频于另一个的那部分词 项表前一个称目标语料库;后一个称参照语语料库,通常规模要大一些,以此来凸 现目标语料库的一些特别高频词以浮现该语料库的主题或内容特色 3.1 凸显目标语料库中显著性高频于对照语料库的词项凸显目标语料库中显著性高频于对照语料库的词项 具体操作方法如下: a)点击 file 下拉菜单中的“open files” ,选择要对比的目标语料的语料(如果对比整 个文件夹,可以选择 open directory) ; b)点击主界面中的; c)点击,选择“Keyword List” , 如图 3.1 所示; d)选择“Show negative keywords” ,可在检 索结果中显示对照语料明显高于目标语 料的词; e)点击,选择对照语料, 最后点击; f)点击,开始检索,检索结果如图 3.2 所示。
图 3.1 Tool Preferences 对话框 8 / 9 精品文档可编辑版 图 3.2 提取关键词表检索结果 9 / 9 。












