好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

如何创建一个英汉双语语料库?如何创建一个任意两种语言的语料库?.docx

3页
  • 卖家[上传人]:公****
  • 文档编号:500487893
  • 上传时间:2023-06-02
  • 文档格式:DOCX
  • 文档大小:155.79KB
  • / 3 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 如何创建一个英汉双语语料库?如何创建一个任意两种语言的语料库?构建一个英汉双语语料库的主要步骤如下:1 、语料准备准备英汉对照的双语文档可以是两个文档,其中一个英文,一个中文;也可以是英中上下对照或左右对照的单文档 无论是双文档还是单文档, 都要注意原文与译文需要严格对照,这是后续软件识别的重要基础文档格式可以是 office系列格式等,但最好是 word 这种简单的容易识别的格式如:我们在 word 中准备一篇英中双语对照的文档可编辑修改 -2 、语料对齐关于语料对齐, 我以前专门写过一篇文章: 如何用最简单的方法创建双语平行语料库?里面讲了几种对齐工具,我推荐的是 Tmxmall 对齐 Tmxmall 对齐功能的具体操作步骤我也写过文章,可参考:双语平行语料库人工对齐工具说明│Tmxmall Aligner我们准备好的英中文档对齐效果如下,将对齐好的文档导出,存为 tmx 格式3 、在 trados 等 CAT 工具中新建翻译记忆库,把之前保存好的 tmx 文件导入即可可编辑修改 -以上就是自己构建一个英汉双语语料库的方法 上述方法同样适用于建立中英语料库或其他任意语言对的语料库,如俄中、中俄、中葡、中日等等,只要在操作的时候选择对应的源语言和目标语言即可。

      除了自己对齐语料存为 tmx 格式外,也可以直接购买 Tmxmall 公有云包月服务(里面有千万级句对的语料资源可供翻译时提取),或在 Tmxamll 语料商城上按需购买其他人放上去的各专门领域的语料库可编辑修改 -。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.