您所在位置：网站首页 > 医学/心理学 > 基础医学 > Praat客服语音标注

Praat客服语音标注.doc

12页

卖家[上传人]：pu****.1

文档编号：536993978

上传时间：2023-10-27

文档格式：DOC

文档大小：11.65MB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

15金贝

下载

/ 12 举报版权申诉马上下载

文本预览

下载提示

常见问题

word语音转写操作手册〔三层〕一、用脚本打开语音文件 1 点击praat—>open—>read from file—>找到你打开的文件—>打开—>选中同一个文件名的两个文件—>View & Edit； 2 Ctrl+2可以同时两层打点，Alt+Backspace可以删除时间点；做完以后Ctrl+S 保存到根文件下面；请参看培训视频二、开始标注语音文件• 时间边界定位：• 按Tab键可以播放语音，再次按Tab键/Esc键可以停止播放语音• 按Ctrl+i可以放大波形；Ctrl+o可以缩小波形建议放大1—2标注• 听音，在整段语音的根底上，根据语义和停顿时间等因素，在音频信号中每一句话的句首和句尾分别添加时间边界添加时间边界的方法为：将鼠标移动到语音波形的相应位置，这时会出现一条虚线以与圆圈，分别点击SPEAKER层和CONTENT层对应的圆圈即可或者直接Ctrl+2可以自动同时在SPEAKER层和CONTENT层打上时间点在整个语音文件中，SPEAKER层和CONTENT层的时间边界的数目是完全一致的，每一对时间边界也是完全相等的请注意，SPEAKER层和CONTENT层的时间边界必须保持一致。

也就是说不管点击哪一层的时间边界，另外一层一定是空心蓝色，而不是实心蓝色• 文件标注：• GLOBAL层主要标注语音文件的一些全局信息，包括说话人性别信息和语种信息〔方言区〕标注格式如下：[speaker]:[空格]1[空格]性别,[空格]2[空格]性别;[空格][language]:[空格]1[空格]方言区,[空格]2[空格]方言区例如：[speaker]: 1 male, 2 female; [language]: 1 普通话, 2 普通话[speaker]: 1 male, 2 male; [language]: 1 普通话, 2 普通话[speaker]: 1 female, 2 female; [language]: 1 普通话, 2 普通话[speaker]: 1 female, 2 male; [language]: 1 普通话, 2 普通话• SPEAKER层需要标注的是说话人信息，“说话人〞取值为以下两种：1、2，分别表示说话人1、说话人2〔说话人1、2仅标注在文字段上，符号段不标注〕• 如果是客服类对话，如此SPEAKER层的“说话人〞取值为1的语音，必须是话务员；用户的语音取值为2• 客服定义为奇数，用户为偶数；〔客服一定是和用户有直接对话，否如此不算客服〕如果第三个人是用户的情况：[speaker]: 1 female, 2 female, 4 female; [language]: 1 普通话, 2 普通话, 4 普通话• CONTENT层需要标注的是该句对应的文字，如果是汉语交谈，如此只能用简体汉字。

对于语音中的数字局部需根据发音情况转换为对应的汉字，例如“27〞→“二十七〞；“我的是2381832〞→“我的是二三八幺八三二〔与发音一样〕〞• CONTENT层正常语音的标注• 如果此语段为某一个人的汉语对话语音，请在SPEAKER和CONTENT标注时间边界，SPEAKER层标注1或者2，CONTENT层输入相应的文本• 如果此语段为两个人交叉语音，关于重叠〔交叉〕的语音，即对于某个人的一句话未完，另一个人的一句话已经开始的情况：请在SPEAKER层和CONTENT层标注时间边界，SPEAKER层不标注内容，CONTENT层标注“+〞对于叠加，必须是真实的不能将大段的听不清语音和叠加混在一起叠加段内的非叠加局部，前后最多不得超过1个字至于由于添加叠加的时间边界导致的半个语音〔即切掉头或者尾〕可用[*]或[UNK]来表示[*]和[UNK]取决于是单段的听不清，还是在语音中听不清• 在整个语音中，需根据说话人的变换来增加时间边界• 如果同一说话人说话时间较长，如此应根据其语义来增加时间边界，每个时间段的长度最多不能超过8s，但断句也不要太散太短每个自然语言段平均在5-6秒左右即可• 每个时间边界的最优位置在音频能量的最低点〔即波谱图上黑色局部最淡的地方〕，如果仅有几个字包含不进来，那么建议舍弃这几个字• 英文：(英文小写)【单词】对于语音中简单的英文单词，在能听懂的情况下，直接标出即可。

特殊符号用发音标注，不写特殊符号例如：“网址是三w点sina点〞； “二三八幺八三二艾特点〞；〔不要写〕 “请以井号键完毕〞；〔不要写#〕【字母】每个字母中间用空格隔开例如：good表示单词读音，g o o d如此表示字母读音例如：我的编号是f m s幺三二• 如果发音是表示应答的“嗯〞，统一都用“嗯〞，不要用“恩〞或者“厄〞其他的这种口头发音，也需要用带口字旁的汉字标注比如哦，啊，唉等.• CONTENT层短暂噪音的标注短暂噪音是指非常短暂的突发的声音，所有此类标注都是中括号与语音内容的组合，不要标注时间边界1 听不清的一个字/英文单词直接在句子中标注[UNK] 例如：二三八幺八[UNK]二 2 两个或者两个以上听不懂的字，标注[*]• 听不清的长句• 方言• 大段的英文句子• 拿着话筒和其他人说话 3 短暂的笑声：直接在句子中标注[LAUGH] 4 短暂的由说话人发出的干扰浊音：直接在句子中标注[SONANT]• 咳嗽声• 打喷嚏• 清嗓子 5 系统提示音，即系统播出的语音提示：[PROMPT]系统自动播放的语音内容，而非说话人的语音内容〔第二层不用标说话人〕例如：[PROMPT]欢迎致电我公司现在由一号客服代表为您服务• CONTENT层持续噪音的标注持续噪音是指比拟长的一段声音，所有此类标注都是单独的噪音类型，需要标注中括号和时间边界，SPEAKER层不标注内容 1 明显的静音段〔大于500ms〕:[SIL]〔如果空白段没有任何声音，可以空着，后期技术处理〕 2 各种垃圾声音：[ENS] 1〕连续的拍桌子 2) 连续的敲击声 3) 持续的各种环境噪音〔大于500ms〕 3 连续的笑声：[LAUGH] 4 持续的音乐声：[MUSIC]• 唱歌声〔有歌词和旋律〕• 哼唱〔没有歌词，但有旋律〕• 口哨声• 可能是别人唱歌、演奏，也可能是背景的电视、收音机发出的音乐和歌声• 口哨声• 包括持续时间较长的彩铃声 5 录音与电信系统引起的噪声：[SYSTEM]包括按键音dtmf、忙音 beap、录音系统的其他噪音等，都是通信系统主动发出的声音，而不是摘机、挂机或干扰带来的咔啦或呲呲杂音。

一般会用的噪音符号：+，[*]，[ENS]，[UNK]，[SONANT]，[LAUGH]，[PROMPT]，[SYSTEM]• 修改标注• 去除端点：点中端点，alt_backspace• 移动端点：直接用鼠标拖动• 修改文字：点中语音段，在编辑框中修改• 保存• Ctrl+S保存到你文件的根目录下面；三工具自查checktool1 先进入程序安装文件夹，安装perl和python程序注意perl安装使用默认路径 C:\Perl\bin\perl，python安装使用默认路径C:\Python27\python 2 点击1_Textgrid_modify —> tmp—>已完成语音放tmp里面—>退出来一步点击run 3 把1_Textgrid_modify中tmp的语音全部复制到—>2_checktool的tmp中—>run看出错的地方，如：intervals [50],说明第50段语音有错，将对应文件的textcheck打开，查找到intervals [50]，查看是什么错误，最后在里面做修改，保存即可〔改一个错误保存一次〕，再重复上面的操作改下一个错误，直到最后没有报错为止。

点击阅读更多内容