
SinoSonicSDK用户手册.doc
45页语音合成开发包SDK V4.10产品使用手册北京炎黄新星网络科技有限公司前 言“炎黄之声”(SINOSONIC)语音合成技术,可以将文本转换为自然、流畅的语音进行输出炎黄之声”(SINOSONIC)是炎黄新星具有世界领先水平并拥有自主知识产权的核心技术它依托于清华大学“人机交互与媒体集成研究所”20余年的研究成果,采用最先进的语音算法,在国内外语音会议上屡获殊荣炎黄之声”(SINOSONIC)采用了目前世界最先进的数据驱动技术,使用精心设计的语音语料库进行录音,得到的系统体现了流畅、自然的语言特性,发音效果自然、亲切,用户乐于接受炎黄之声”(SINOSONIC)在国内首次运用“基于神经网络的韵律模型”,使系统具有智能化的学习功能,能够自动记忆、自我培训,灵活进行语音、语调的选择,让系统能够逐渐模拟人的发音效果炎黄之声”(SINOSONIC)是国内唯一一家获得国家级发明专利的语音合成技术,“让电脑说中国话,用中国人自己的专利”是整个研发团队不懈的追求!“炎黄之声”(SINOSONIC)作为世界级的语音合成技术,运用了最先进的语音算法和模型,其核心技术包括:基于神经网络的韵律模型、基于HMM的语音切分和选取模型、基于HMM的多语种文本分析和语义分析、中英文语料库设计和标注、语音分析工具的研制等。
目 录前 言 1第一章 产品介绍 41.1产品功能 41.2产品特点 41.3产品应用 4第二章 产品安装及卸载 62.1 运行环境 62.2安装过程 62.3卸载过程 10第三章 目录结构及文件说明 173.1目录结构 173.2文件说明 17第四章 函数使用说明 184.1函数列表 184.2 ttsInit 194.3 ttsClose 194.4 ttslogon 194.5 ttslogdown 204.6 ttsPlay 204.7 ttsGenderSet 234.8 ttsGenderGet 234.9 ttsSpeedSet 244.10 ttsSpeedGet 244.11 cttsPitchSet 254.12 cttsPitchGet 254.13 cttsSpeedSet 264.14 cttsSpeedGet 264.15 ettsSpeedSet 264.16 ettsSpeedGet 274.17 ttsGBorBig5 274.18 ttsLanguageSet 284.19 ttsLanguageGet 294.20 ttsParamSet 294.21 ttsParamGet 304.22 ttsChangeWaveFmt 304.23 ttsPcmToWave 314.24 ttspcmtoalaw 314.25 ttspcmtoulaw 324.26 ttspcm16to8 324.27 ttspcm8to16 334.28 ConvertToVox8 334.29 ConvertToVox 344.30 ttsWriteToFile 354.31 ttsWriteToFileEx 35第五章 USERMAN.EXE使用说明 375.1添加汉字单词 375.2修改汉字单词 385.3删除汉字单词 395.4排序汉字单词 395.5添加英文字符串 395.6修改英文字符串 405.7删除英文字符串 415.8排序英文字符串 415.9重新装入用户词典 415.10保存用户词典 415.11问题解答 42第六章 范例 43联系方式 44第一章 产品介绍语音合成开发包,充分运用“炎黄之声”语音合成技术,为系统集成商、软件开发商提供了完备的接口函数和编程实例,使用户能够灵活的进行调用,并集成到其它应用系统中。
目前,炎黄新星已经成功推出了SDK V1.0、SDK V2.0、SDK V2.1、SDK V3.0、SDK V3.2、SDK V4.1等多个版本,其中SDK V1.0成功嵌入在汉王公司的产品中,目前使用用户已经达到百万户语音合成开发包SDKV4.1是炎黄新星最新推出的产品,它与其它几个版本相比,在产品特点、功能、性能方面产生了质的飞跃1.1产品功能1. 系统可提供连续的、高自然度和高清晰的合成语音2. 内嵌具有自主版权的连续英文语音合成系统3. 自动识别并处理GB、GBK和BIG5字符集4. 能正确处理汉语中的标点、数字、运算符等5. 支持计算机内置声卡及多种语音卡6. 提供标准的程序函数接口,可方便地进行二次开发7. 提供放音时暂停、恢复、终止等各项操作接口8. 提供语音字典维护功能,用户可根据实际情况添加、删除、更改词库中某些词或特殊字符的发音9. 炎黄英文或微软英文用户可自选1.2产品特点1. 国内首家采用神经网络韵律模型,使系统具有自我学习、自我培训的智能功能,选音准确度大大提高2. 采用长句录音,语言的自然度得到了提高3. 音库采用中央广播电台的主任级播音员录音4. 接口API支持多线程开发,大大提高系统运行效率。
5. 中英文语音合成系统都具有自主版权,中英文混读效果好1.3产品应用SinoSonic SDK Version 4.1语音合成开发包的应用可包括:1. 自动声讯2. 专利查询3. 证券代理4. 银行5. CALL CENTER6. Internet信息的有声传送第二章 产品安装及卸载2.1 运行环境1. 主机处理器: PIII500及以上2. 主机内存: 256MB3. 操作系统: Windows9x、WindowsNT4.x、Windows20002.2安装过程不同Windows环境下的安装方式大致相似:第一步:将安装光盘放入光驱内,软件会自动运行光盘中的安装程序,安装程序启动后会出现炎黄之声SDK V4.1语音合成系统的安装界面,如下图如不能自启动,请运行光盘中的setup.exe程序第二步:点击“下一步”按钮,进入安装许可协议界面点击“是”进入输入注册信息界面输入产品的序列号,该序列号可以在安装光盘的SN.TXT文件中找到输入完序列号,点击“下一步”进入选择安装路径界面选择完安装路径后,点击“下一步”进入选择安装类型界面选择完安装类型,点击“下一步”进入选择安装程序文件夹界面输入新的文件夹名称,也可以使用系统默认文件名,点击“下一步”按钮开始拷贝文件,拷贝完文件后,出现安装完成页面。
点击“完成”按钮,安装完成注意: 如在 Windows NT 环境下用户必须具备 Administrator 的使用权限, 安装完毕后必须重新启动系统.第三步:安装软件狗A、首先关闭计算机B、然后将软件狗(有并口和USB口两种)插在并口或USB口上C、启动计算机注意:在Windows NT环境中一定要以Administrator身份进入系统D、如果是第一次安装USB硬件,系统会提示查找到新硬件, 并自动安装对新硬件的驱动安装光盘中带有USB硬件的驱动程序2.3卸载过程卸载顺序:首先卸载软件狗,然后卸载USB驱动程序,最后卸载“炎黄之声SDKV4.1正式版”软件一、Windows2000下的卸载方法:第一步:卸载软件狗驱动程序:点击Windows“开始”菜单中的“运行”在运行窗口中输入s3_inst.exe /u命令行,点击“确认”按钮即可 注: 如在 Windows NT 环境下用户必须具备 Administrator 的使用权限, 卸载完毕后也需要重新启动系统. 第二步: 卸载USB驱动程序:1. 打开“开始菜单----设置------控制面板”页面2. 双击“添加/删除硬件”图标。
3. 然后根据提示单击下一步4. 在“选择您想卸载的设备”中,选中“USB Root Hub”点击“下一步”按钮,进入确认卸载界面选择“是,想卸载此设备(Y)”,点击“下一步”按钮完成卸载第三步:卸载炎黄之声SDKV4.1正式版程序:1. 打开“开始菜单----设置------控制面板”页面2. 双击“添加/删除程序”图标3. 找到并选中“炎黄之声SDKV4.1正式版”,点击选中栏中右下方会的“更改/删除”按钮,进入炎黄之声SDKV4.1正式版安装维护程序界面选中“删除”项,点击“下一步”按钮,进入确认删除界面点击“确认”按钮卸载完成二、Windows98下的卸载方法:第一步:卸载软件狗驱动程序:点击Windows“开始”菜单中的“运行”在运行窗口中输入s3_inst.exe /u命令行,点击“确认”按钮即可第二步: 卸载USB驱动程序:1. 开始菜单----设置------控制面板2. 双击“系统”3. 选择“设备管理器”Tab,在列表框中选中“通用串行总线控制器”下的“USB Root Hub”,单击“删除”按钮4. 然后根据提示卸载即可第三步:卸载炎黄之声SDKV4.1正式版程序:1. 开始菜单----设置------控制面板2. 双击“添加/删除程序”选择“安装/卸载”Tab,在列表框中选中“炎黄之声SDKV4.1正式版”,单击“添加/删除”按钮。
第三章 目录结构及文件说明3.1目录结构 Data: 该目录中放置的是软件所需的音库和词库内容和UserMan.exe Bin: 该目录中放置的是TTS所需的动态链接库和SSPlay.exe(语音合成演示程序) SDK_Demo : 该目录下放置的是接口API使用的例子程序 Help : 该目录下放置的是帮助文件 Driver: 该目录下放置的是软件狗的驱动3.2文件说明 UserMan.exe 是用来编写用户词典的,可以扩大TTS合成系统的词库量具体帮助请看 Bin\USERMAN.HLP. SSPlay.exe 是用来检查合成效果的测试程序 本软件共提供一套API开发接口: TTS SDK API接口,用来开发合成系统例子程序在 SDK_Demo中, 需要SDK_Demo\ectts.h和SDK_Demo\ectts.lib两个文件 API的使用帮助请见 Help\SINOSONIC_SDK_V4.10用户手册.doc第四章 函数使用说明4.1函数列表本软件包包括如下接口函数:1. ttsInit 初始化TTS合成系统。
2. ttsClose 关闭TTS合成系统3. ttslogon 创建语音合成的线程环境4. ttslogdown 关闭语音合成的线程环境5. ttsPlay 将文本合成语音数据6. ttsGenderSet 设置TTS合成系统说话人的性别7. ttsGenderGet 获得TTS合成系统说话人的性别8. ttsSpeedSet 设置TTS合成系统语速9. ttsSpeedGet 获得TTS合成系统语速。
