好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

合成语音感知学习模型的建立和效应验证【医学论文】.doc

7页
  • 卖家[上传人]:飞***
  • 文档编号:7447723
  • 上传时间:2017-09-21
  • 文档格式:DOC
  • 文档大小:32.50KB
  • / 7 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 医学论文-合成语音感知学习模型的建立和效应验证作者:王立锋,廖琪梅,苗丹民【关键词】 合成语音Perceptual learning of synthetic speech sound: Model building and verification【Abstract】 AIM: To build a model of synthetic speech sound learning and to verify its effectiveness. METHODS: The perceptual learning model was programmed and applied in 29 college students, who were randomly divided into 4 groups (6 students in group 1 and 2 respectively, 7 in group 3 and 10 in group 4). Paired ttest and ANOVE were utilized to verify its effectiveness. RESULTS: The model was employed in 4 kinds of experimental procedures. The average performance of all groups was markedly improved from (11.76±0.87)% before learning to (20.69±1.59)% after learning (P<0.01). Of the 4 groups, the programoptimized group achieved the most remarkable learning effect, improved by an average of (14.10±2.52)%(P<0.001). CONCLUSION: A good learning effect is observed in our model, which presents generalization rather than rote memorization. The model lays a basis for indepth research in the field of more complex cognitive activities.【Keywords】 perceptual learning; model; synthetic speech sound【摘要】 目的: 建立合成语音的感知学习模型并验证该模型的学习效应.方法: 编写合成语音感知学习模型的计算机程序,并在 29 名大学本科生中应用该程序模型. 将被试学员随机分为 4 组: 组 1(n=6),组 2(n=6),组3(n=7),组 4(n=10). 采用配对 t 检验和方差分析验证该模型的学习效应.结果: 依照 4 种不同的实验模式实施该模型,各组平均得分由学习前的(11.76±0.87)%提高到学习后的(20.69±1.59)%,且具有显着性差异(P<0.01). 其中程序模型改良组的学习效果最为显着,成绩平均提高了(14.10±2.52)%(P<0.001). 结论: 本研究所建立的英语合成语音感知学习模型有良好的学习效应,学习的过程体现出了人的概括和泛化能力. 该模型为深入研究比较复杂的认知活动奠定了基础.【关键词】 感知学习;模型;合成语音0 引言针对感知学习的研究模型有许多种,其中绝大多数是针对记忆的,包括研究程序性记忆的运动技能学习[1],研究知觉表征系统的视觉[2]或听觉[3]辨别任务等. 在合成发音的感知学习过程中,人们对于不同字符组合发音规律的学习和掌握反映除记忆之外的其它学习技能,其模型为人们深入研究学习的生理心理机制提供了帮助[4]. 本研究旨在尝试建立基于英语语音的感知学习模型,并以中国青年为被试验证该模型的学习效应.1 对象和方法1.1 对象29 名健康男性大学生,年龄 19~21 (平均 20.7)岁. 裸眼视力或矫正视力正常,听力正常,均已通过英语四级考试,右利手,熟悉计算机键盘操作,从未参加过类似实验. 全部被试根据所采用的程序和词汇列表随机分为 4 组. 组 1 和组 2 各 6 人,组 3 为 7 人,组 4 为 10 人. 模型中采用的单词为辅元辅结构的单音节英文词(如 bad, tap 等),词汇的选取来源于各个英语音素分布均匀的语音均衡表[5]. 单词的发音由程序合成,在 PⅢ计算机上运行并测试,语音通过 Yong Wei 耳机(YW810MV)播放.1.2 方法  模型设计了两个略有差别的程序(A 和 B). 程序 A 与 B 均包含测试、练习(多组)和再测试三个阶段,练习包括学习和复习两个环节,程序 B 练习的学习环节单词的发音能够点击重听. 程序 A 有两个版本的词汇列表(L1 和 L2),程序 B 仅有一个版本的词汇列表(L2),L1 完全来源于 Fenn 等[4]的设计,L2是范围限制在四级词汇之内的语音均衡词汇. 具体程序为: ① 测试阶段包含100 个单词,要求被试在听到单词的(合成)发音后在计算机上键入与之对应的拼写,每个单词的发音只出现 1 次,而且不会重复,单词之间间隔 10 s. ② 练习包括两个单元,每单元两组或者三组,每组 50 个单词. 每组间被试休息 2 min,单元间休息 10 min. 每组被试先学习,即在听到每个单词的发音后随即看到与之对应的拼写(程序 A 中每个单词的发音只呈现 1 次,而程序 B 中,被试在同样的时间间隔内能通过点击操作重复听到当前单词的发音). 50 个单词之后,被试可以进行复习. 复习时,被试在听到发音之后,有 6 s 时间可以将单词键入空栏,并在随后看到该单词的正确拼写. 在整个学习的过程中,被试所听到单词没有重复,也不与测试及再测试中的单词重复. ③ 再测试与测试的形式与要求相同,单词不与测试及练习中的单词重复. 组 1 采用程序 A 和词汇列表 L1,完成 6 组练习;组 2 采用程序 A 和词汇列表 L1,完成 4 组练习;组 3采用程序 A 和词汇列表 L2,完成 6 组练习;组 4 采用程序 B 和词汇列表 L2,完成 6 组练习.统计学处理: 统计学分析用 SPSS10.0 统计分析软件包,结果采用(x±Sx)表示. 统计方法采用配对 t 检验,单因素方差分析和协方差分析. P<0.05 表示有显着性差异.2 结果  2.1 英语合成语音感知学习模型的学习效应所有被试在测试时语音识别的平均得分(11.76±0.87)%,练习后,绝大部分被试的正确率都有所提高,平均提高(8.93±1.25)% (t=7.125, P<0.001)(图 1).尽管组 1 和组 2 所使用的词汇列表与组 3 和组 4 不同,但是,各组被试在测试时反映出来的正确率却未见显着差异(F(3,25)=1.322, p=0.29). 组 1 在学习阶段完全采用了文献所报道的实验方法,经过 6 组共 300 个单词的学习后,语音识别的正确率由测试的(13.00±2.03)%提高到学习后再测试的(20.50±2.38)%,平均提高(7.50±2.00)% (t=3.758, p=0.013). 与之相比较,组 2 平均提高(5.00±1.91)% (t=2.611, p=0.048). 组 3 学习后正确率平均提高(6.14±1.12)% (t=5.476, p=0.002)(图 2).2.2 学习形式影响语音感知学习的效果基于组 1, 2, 3 的实验结果,我们发现,通过练习或者学习,被试的成绩尽管有显着的提高,但是提高幅度不是很理想(平均约 6.21%). 为了防止实验过程中有可能出现的“地板效应”,我们通过问卷调查的形式,总结出了一些可以促进学习效果的方法,并且将它们以可执行的操作方式加入了改良后的程序 B. 在使用程序 B 的组 4 中,我们发现该组被试的正确率由学习前的(13.40±1.63)%提高到了学习后的(27.50±3.13)%(图 2),平均提高(14.10±2.51)% (t=5.618, p=0.0003). 而各个组之间以测试正确率为协变量(总均数为 11.76)比较的协方差分析也表明,组 4 成绩的提高与组 1, 2, 3 相比较均有显着差异,同时组1, 2, 3 成绩的提高之间则未见有显着差异(表 1).表 1 各组所提高成绩的比较和协方差分析(略)3 讨论针对感知学习的研究在揭示人类的学习、记忆等高级认知活动的生理和心理机制方面有着极为重要的作用[5-6]. 感知学习的研究模型有很多种,主要集中在视觉[2, 7, 8]、听觉[9-10]和运动[1, 11]三大领域. 这些模型大多数都是只针对视觉或者听觉的刺激信息来做出的识别、记忆或者辨别反应. 然而,除了记忆之外,学习的过程中还有更复杂的感知活动参与. 语音学习时,由于在不同的字符(音素)组合中,相同的发音单元(字符)常会因为其前后所连接字符的不同而表现出不同的发音,而不同的发音单元(字符)也会由于其前后所连接字符而表现出相同的发音. 因而,对于语音发音规律的学习和掌握就不是单凭记忆不同音素的发音模式可以完成的. 它还需要记忆之外的概括和泛化能力[4]. 语音学习任务为人们进一步深入的研究感知学习提供了非常有意义的模型.人工合成的英语发音非常难于识别,即使在母语是英语的被试中,初次识别的成功率也只有 33%左右[4]. 这主要是因为机械的发音模式与人类自然的语音发音有明显的区别,人们在对合成发音初次感知时,很容易产生错误的知觉. 不过,有研究表明,一段时间的规律学习能使得对合成发音识别的正确率提高平均约 45%,而即使只是短期的一次性集中学习,正确率也能提高平均约20%[4]. 本研究尝试了以中国青年为被试的合成英语语音感知学习模型. 由于英语不是母语,而且人工合成发音本身难于识别,因此,在整个实验过程中,被试对语音识别的正确率普遍都比较低(测试时平均约 11.76%). 尽管如此,学习或者说练习能够有效的提高被试的成绩(练习后提高了平均约 8.93%). 由于被试听到的单词不重复,在识别单词的发音时,成绩的提高就完全有赖于对一过性的发音和拼写进行高度的概括和泛化,并把获得的规律应用到新单词中去,以此来适应新的测试内容. 从影响感知学习效果的因素方面考虑,我们认为词汇的难易程度、练习量以及学习的方式都是比较重要的影响因素. 本研究中,我们发现优化后的学习程序使被试正确率的提高达到了平均约 14%, 与Fenn 等[4]所得到的数据接近,可以说是较为显着的提高了学习的效果. 我们由此认为,学习方式对感知学习的效果有显着影响. 选择不同的词汇列表以及调整练习的数量并未在不同的被试分组之间得出差异显着的结论,考虑到本研究所涉及的被试数量较少,我们正在尝试扩大被试数目以及对词汇的难易程度和练习量进一步的分级,以期能够更好的对上述各因素做出解释.  【参考文献】[1] Fischer S, Hallschmid M, Elsner AL, et al. Sleep forms memory for finger skills [J]. Proc Natl Acad Sci, 2002,99:11987-11991.[2] Karni A, Sagi D. Where practice makes perfect in texture discrimination: Evidence for primary visual cortex plasticity [J]. Proc Natl Acad Sci USA, 1991,88:4966-4970.[3] Gaab N,。

      点击阅读更多内容
      相关文档
      局长在2025年全市医疗保障重点工作调度会暨定点医药机构违法违规使用医保基金自查自纠工作推进会上的讲话稿.docx 2025年春教体系统安全工作会上的讲话范文.docx 2024年度街道机关支部党组织书记述职发言材料供参考.docx 2025年干部谈心谈话内容范文.docx 主管发改部门党组书记在党委理论学习中心组学习研讨会上的发言材料供参考.docx 学习关于党的建设的重要思想交流发言材料供参考.docx 纪委书记2025年全面从严治党的研讨材料范文.docx 2025年春季防汛防旱工作部署会上的讲话范文.docx 2025年村“三资”管理工作计划供参考.docx 村“两委”2025年工作计划供参考.docx 乡镇在全市履行职责事项清单工作会议上的交流发言.docx 银行行长在学习2025年一号文件精神专题会上的研讨发言供参考.docx 乡党委乡村振兴工作经验总结供参考.docx 党组书记、主任在2025年展改革委民营企业座谈会上的讲话范文.docx 领导干部在2025年“纪检监察工作规范化法治化正规化建设年”行动动员部署会议上的讲话范文.docx 关于落实全面从严治党主体责任报告范文.docx 在2025年基层履行职责事项清单工作会议上的交流发言例文.docx 2025年理论学习中心组党风廉政建设专题学习研讨会议上的交流发言供参考.docx 在理论学习中心组推动经济社会高质量发展专题学习研讨会议上的交流发言两篇.docx 党支部2024年民主评议党员工作情况报告供参考.docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.