结合结构的自适应波束形成和盲源分离的语音识别的智能服务机器人.doc

下载文档

0
0
约2.24万字
约 18页
2024-09-03 发布于广西
举报
版权申诉
保障服务

结合结构的自适应波束形成和盲源分离的语音识别的智能服务机器人.doc

1、本文档共18页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

结合结构自适应波束的形成和盲源别离的效劳型智能语音识别机器人

摘要

在噪声的环境下，成功的智能语音识别机器人的性能取决于预处理分子的使用。尽管声波信号往往在高噪声水平的环境中遭到破坏，语音识别系统，如广泛使用的HTK，无法做到处理信号失真问题。我们建议使用一种结构，这种结构在算法空间域中有效地结合了自适应波束形成〔ABF〕和盲源别离〔BSS〕。为了防止在BSS系统中数组的歧义和多重计算的复杂性，广义的自适应旁瓣对消用于之前的BSS系统。在硬件实现中，为了进行快速处理，我们略微改良了传统的BSS卷积混合模型。不同于传统的BSS，它不会产生数组的歧义，由于前线波束形成器的目标角是固定的，所以它总是提供增强的和参考的噪声信号给BSS的两个预定义输入。在BSS中，当BSS的多于两个输入时，拟议的系统也会减少多重计算。拟议的时域方法可以容易地落实到实时硬件。我们用一个DSP模块评估其结构和性能。语音识别测试的实验结果说明，比起ABF和BSS系统，该组合系统保证了在噪声环境中较高的语音识别率和较好的性能。

1、引言

智能机器人受到越来越多的关注。如电视和报纸等媒体已经展示过双足类人机器人。由于硬件和控制技术的开展，机器人的动作已在外表上与人相似。然而，作为人与机器人互动的第一步，无误的语音识别还没能到达足以执行像人类智力一样的类人程度。成功的语音识别率只有在安静的条件和在声源靠近机器人的时候才能保证。如果噪音或干扰音量太高或在没有使用耳机的情况下机器人远离用户超过1米，语音识别率将急剧下降。由于这些原因，语音识别率在现实世界中远低于在无声状态下。这使得它需要基准于人类的听觉识别力，某种意义上说，我们只注重辨识来源于特定方位的特殊声音的能力。我们分别用自适应波束形成〔ABF〕和盲源别离〔BSS〕技术良好的定位和别离噪音来描述这种听觉。

2、背景

2.1波束形成

波束形成是一个信号控制方向定向化并且使该信号具有高敏感性至理想化的程度。波束形成历来用于军事目的，特别是在雷达和声纳装置的领域。最近，它被用于工程领域作为处理无线麦克风阵列通信与智能天线的信号。根据其更新性的过滤负荷，这项技术被分为常规波束形成和自适应波束形成。常规波束形成具有结构简单，计算复杂性低的特点。一个经典型常规波束形成器是延迟-结合波束形成器。在延迟-结合波束形成器中，声源被认为是遥远的从麦克风传来的并且传播的形式类似于飞机波。声音到达的方向，麦克风的数量，和每个麦克风阵列之间的距离是优先的信息。输入语音信号根据他们的波达方向〔DOA〕被延迟。只有信号在所期望的方向是这样强调。然而，没有解释处理介入的干扰并且大量麦克风需要在延时-结合波束形成器中形成一个确切的束。

自适应波束形成器有自适应滤波器，可使波束形成器的负荷在形成过程中自适应改变。因为它在干扰方向自适应地制造空值不断优化性能，所以未知干扰被处理。最著名的宽带波束形成自适应波束形成器是被Frost建议的约束最小功率的自适应波束形成器。在定位时，它是能够满足某些理想频率响应，与此同时使用约束极小输出总功率的方法尽量减少输出噪声功率。Griffiths和Jim重新考虑了它并介绍了广义旁瓣对消〔GSC〕。GSC由稳定的波束形成器、封锁矩阵、参考信号和多输入抵消器组成，其中，波束形成器能够产生满足期望约束的波束，封锁矩阵能够产生噪声/干扰，参考信号用于封锁有效信号，多输入抵消器试图在稳定的波束形成器输出波束时进一步取消噪声/干扰信号。GSC有一个简单的计算结构，但它在有效信号比干扰信号更强时失效。因为有效信号越强，输出总功率越大，所以导致有效信号被消除。为了改善GSC，已提出许多方法来减少转向装置矢量误差，传感器定位误差，阵列通道失配误差等。但是，在响应的条件下，在理论延时信道没有进行时，这些方法有其局限性。

2.2盲源别离

盲源别离〔BSS〕是指一种在无信道信息时从线性混合信号中恢复源信号的方法。在声学领域，由于延时的源信号和反射回来的信号相叠加而成的混合信号称为卷积混合模型。卷积混合模型的表达式如下。

{hij,p}是第j个声源和第i个麦克风之间的脉冲响应空间，xi(t)是信号在t时刻出现在第i个麦克风。

解决卷积混合模型比实时别离混合信号需要更多参数。在复原过程中存在信号缩放比例和置换问题。如果有两个以上的信号源和两个麦克风，那么将难以解决置换的歧义性。

2.3几何源别离

正如在上一节中所说，卷积盲源别离和自适应波束形成算法有类似的目标。这就是说，这两个算法都试图从混合传感器使用过滤器阵列获取源信号。然而，ABF和BSS算法在于信息的使用关系不同。虽然BSS使用空间和频域信息，但是自适应波束形成只利用源信号和传感器阵列的空间信息。因此BSS算法存在缩放比例和置换歧义的问题。ABF只使用二阶统计，并且有串