中文语音识别技术c_中的应用.doc

  1. 1、本文档共1页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中文语音识别技术c_中的应用

.Net平台下开发中文语音应用程序 语音是人类最自然的交互方式,也是现阶段软件用户界面发展的最高目标。微软公司一直积极推动语音技术的发展,并且公布了语音开发平台Speech SDK帮助开发人员实现语音应用。 随着.net技术深入人心,越来越多的程序员开始转到.net平台上进行开发。然而,在新发布的.net speech SDK里面并没有对中文语音进行支持,目前支持中文的Speech SDK最高版本为Windows平台下的SAPI 5.1 ,本文介绍如何在.net平台下利用SAPI5.1开发中文语音应用程序。 目录: 1. SAPI.51 SDK浅析以及安装 2. 导入COM对象到.Net 3. 用C#开发中文TTS应用程序示例 4. 结论 5. 参考文献 1. SAPI.51 SDK浅析以及安装 SAPI SDK是微软公司免费提供的语音应用开发工具包,这个SDK中包含了语音应用设计接口(SAPI)、微软的连续语音识别引擎(MCSR)以及微软的语音合成(TTS)引擎等等。目前的5.1版本一共可以支持3种语言的识别 英语,汉语和日语 以及2种语言的合成(英语和汉语)。SAPI中还包括对于低层控制和高度适应性的直接语音管理、训练向导、事件、语法编译、资源、语音识别 SR 管理以及TTS管理等强大的设计接口。其结构如图 1 : 图 1 语音引擎则通过DDI层(设备驱动接口)和SAPI SpeechAPI 进行交互,应用程序通过API层和SAPI通信。通过使用这些API,用户可以快速开发在语音识别或语音合成方面应用程序。 SAPI5.1 SDK可以从微软网站下载:/speech/download/sdk51/ 需要安装程序的有Speech SDK 5.1(68M)和5.1 Language Pack (81.5M)。 2. 导入COM对象到.Net SAPI5.1的基于Windows平台的,通过COM接口进行调用。在.Net平台下要应用SAPI5.1,我们可以利用.Net Framework自带的强大工具TlbImp.exe来把SAPI SDK的COM对象导入到.Net中。TlbImp.exe产生一个管制的包装类,管理客户端可以使用它。包装类管理实际的COM对象的参考数。当包装类当作收集的垃圾时,包装类释放掉它包装的COM对象。当然,你也可以在VS.NET环境中通过从项目参考对话框选择COM对象,实现COM对象的导入,这个过程也是通过TlbImp.exe来完成的。 下面演示如何导入SAPI的COM对象: D:\Program Files\Common Files\Microsoft Shared\Speech Tlbimp sapi.dll /out: DotNetSpeech.dll 在安转SDK以后,可以在D:\Program Files\Common Files\Microsoft Shared\Speech\目录下面找到SAPI.dll,这里面定义了SAPI的COM对象,用Tlbimp.exe工具将该dll转换成.net平台下的Assembly---DotNetSpeech.dll,转换的过程会提示不少的警告 warning ,但这部影响我们的开发,可以忽略。最后,我们可以用ildasm查看DotnetSpeech.dll里面的对象。 3. 用C#开发中文TTS应用程序示例 下面通过一个实例来介绍如何利用C# 进行开发语音应用程序,开发环境为: 操作系统: Windows 2000 中文版+ SP3 .Net Framework: 1.0.3705(英文版) Visual Studio.Net 7.0.9466(英文版) 首先,新建一个C#的Windows Application工程SpeechApp,在开发环境的右边的解决方案管理器 Solution Explorer 中,添加DotNetSpeech对象库。右键点击Reference 参考 ,选择Add Reference(添加参考),在弹出的文件选择对话框中找到刚才生成的DotNetSpeech.dll。 图 2 打开Form1.cs代码文件,在代码开头添加名字空间(注意大小写)。 using DotNetSpeech; 这样就实现了SAPI SDK的导入,下面我们就可以开始编写应用代码了。本示例演示如何把文本通过喇叭朗读出来以及把文本转化成语音信号(Wave声音文件),程序界面如图 3 : //朗读 private void buttonSynthesis_Click object sender, System.EventArgs e try SpeechVoiceSpeakFlags SpFlags SpeechVoiceSpeakFlags.SVSFlag

文档评论(0)

xciqshic + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档