带语音识别功能的消费电子产品的系统设计.docVIP

带语音识别功能的消费电子产品的系统设计.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
带语音识别功能的消费电子产品的系统设计 作者:Erich Ad…文章来源:电子系统设计点击数:81 更新时间:2008-4-23 过去,语音识别的应用一直局限于基于PC的系统、电话服务器、高端手机和PDA。但近年来,技术的进步已使得低成本的语音识别处理器在消费电子领域得到应用。 现在的语音识别处理器集成了更多功能,它们的精确度也更高,并有更好的开发工具支持,这使得在消费电子产品中添加语音I/O变得相对容易。在用语音控制家庭环境照明便是一个具有市场潜力的消费应用。 语音识别的类型 语音识别(有时也被称为声音识别或VR)技术可分成三大类:与说话人无关(SI)的识别技术、与说话人相关(SD)的识别技术和语音确认(SV)技术。每种技术都有各自的优点,适用于不同的应用。采用SI技术的产品要求无需对使用者进行培训便可使用的语音指令。 例如,与说话人无关(SI)的识别技术通常最适合用于照明控制器。就像我们用名字来引起他人的注意一样,用一个被称为“触发(trigger)”的SI指令来激活照明控制器也是一个不错的方法。照明控制器被激活后,它可以接受多个指令。 集成了语音识别功能的产品通常需要一种方法,以让使用者知道它们已经听到指令并准备接受下一个指示。也就是说,它们必须让使用者知道该产品已在控制流程之中。由于控制流程十分简单,照明控制器将用一个短音作为应答,这可缩短使用者与控制器的交互时间,而且如果发生误启动也不会导致太大问题。 由于语音是人类的天生交流方式,所以语音识别功能可以增加产品的易用性,此外它还延伸了使用者的物理控制范围。例如,一个语音控制的照明开关即可提供此类价值。或许使用者正坐着看电视,而照明开关不在伸手可及的范围内,或者环境太暗,看不到照明开关,此时借助一个简单的语音指令就能方便地解决这些难题。 图1:一个典型的具语音识别功能的电灯控制器将采用本流程图中显示的步骤进行操作。 设计考虑 因为语音识别建立在概率函数的基础上,所以设计者必须在接受指令(包含在识别指令集合中)和拒绝指令(不包含在识别指令集合中)的重要性之间做出折衷。例如,如果该产品必须反应非常灵敏,且偶尔发生误接受(误启动)也不会酿成大问题,则应用开发者可能倾向于接受指令更重要些。而其它一些应用则不允许误启动,如声控烤箱或照明控制器。 背景噪声是语音识别的克星。检测和识别均要求信噪比(SNR)在合理的范围之内(约为3:1或更高)。如果应用条件允许,最好使用定向麦克风或近讲麦克风来降低噪声。 成本也是一个考虑因素。当最终使用者购买产品时,产品价格已经是原始制造成本的4到5倍。幸运的是,目前市场上提供的高集成度语音处理器包含了所必需的麦克风前置放大器、模数转换器(ADC)、数字滤波器、内核处理器、数模转换器(DAC)和数学运算引擎。 这些处理器同样捆绑了从文本输入到与说话人无关(T2SI)的识别及合成技术。这些芯片也可充当各种消费产品功能的主控制器,而且其价位对消费电子产品来说颇具竞争力。这使得产品在增加语音功能的同时,只增加很少成本,或不增加成本。 照明控制器的设计原理 这些优异的性能使VR照明控制器非常具有吸引力,同时还有助于解决该应用中的语音识别挑战。在家庭环境中,远距离识别一个指令意味着要排除人说话、电视、音乐、碗碟碰撞和撞门等背景噪声的影响。此外,这类应用也必须能适应不同性别的成人和孩子。 语音识别输出的信号完整性只跟经过处理的信号一样,因此适当的麦克风电路设计是最基本的。麦克风电路的设计应使得麦克风、偏置电阻和前置放大级的组合电路可以充分利用ADC的输出位数,即尽可能利用ADC的输出位数来达到最佳分辨率,并且不饱和。另外,设计还应考虑到人们轻声或大声说话时的可能功率范围,以及照明控制器可能被使用的距离范围(通常最大约为10英尺)。 最好把照明控制器设置成避免误启动,(在嘈杂的环境中,使用者有时可能不得不重复发出指令),利用Quick T2SI工具的设置可实现这点。保持指令集的规模尽可能小,对尽量减少错误指令带来的误操作十分重要,特别是在嘈杂的环境(如在家中)。为使指令之间的差异最大,T2SI指令在声音和长度方面应尽可能地不同。 最后,照明控制器的逻辑流程必须简单、自然,方便使用。为避免使用者混淆,应尽可能减少从引起照明控制器的注意到进入活跃指令集状态的控制步骤。活跃指令集应一直包含触发字的复本,因而使使用者可以在任何时候重建自己在该流程中的位置。触发字应该很易于地与照明控制功能关联起来,而活跃指令必须是照明控制最常用的。图1对设计将要用到的流程进行了说明。 图2:Sensory公司的VR stamp是一个低成本的模块,可通过加入语音识别系统所必需的基本功能和组件来简化设计。 硬件设计 为简化照明控制器的开发,本例中使用了Sensory公司的VR

文档评论(0)

anma + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档