- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
工程设计报告
工程设计报告
——基于DSP的语音信号处理系统
小组成员: 王亨 谢瞻远 王雪
设计背景
语音信号是人类传播信息和情感交流的重要媒介,在许多领域中具有广泛的应用前景。然而在现实生活中,语音不可避免地要受到周围环境、传输系统本身产生的噪声以及其他讲话者的干扰,因此在接收端的信号为带噪语音信号。混叠在语音信号中的噪声按类别可分为加性噪声和乘性噪声;按性质可分为平稳噪声和非平稳噪声。
当语音受到噪声干扰时,会使许多语音处理系统的性能急剧恶化。比如,语音识别在实验室环境下可以取得相当好的效果,但在噪声环境中,尤其是在强噪声环境中使用时,系统的识别率将受到严重的影响。此时,采用语音增强技术进行预处理,将有效改善系统性能。语音增强的目的就是从带噪语音中尽可能提取纯净的语音信号,但是噪声信号都是随机产生的,完全消噪是不可能的。因此,实际语音增强的目标主要是:改进语音质量,降低背景噪声,使听者乐于接受,不感到疲倦,提高语音的可懂度,方便听者理解。
设计原理
本次工程设计中进行语音信号增强及降低背景噪声时,主要采用了两种设计方法。其中第一种为谱减法,第二种为LMS自适应滤波法。
谱减法
在处理未知噪声和线性滤波干扰的问题上,谱减法具有非常重要的影响。由于语音信号的短时谱具有较强的相关性,而噪声的前后相关性很弱,因此可利用短时谱估计的方法从带噪语音中估计原始语音。由于人耳对语音相位感受不敏感,可将估计的对象放在短时谱的幅度上。
假设为纯净语音信号,为噪声信号,为带噪语音信号,则有
用分别表示的傅里叶变换,则可得下式:
由于假定语音信号与加性噪声是相互独立的,因此有
因此,如果用分别表示为的功率谱,则有
而由于平稳噪声的功率谱在发声前和发声后可以认为基本没有变化,这样可以通过发声前的所谓“寂静段”(认为在这一段时间内没有语音只有噪声)来估计噪声的功率谱,从而有
这样减出来的功率谱即可认为是较为纯净的语音功率谱,然而,从这个功率谱可以恢复降噪后的语音时域信号。
在具体运算中,为防止出现负功率谱的情况,减谱时,若,令,即完整的减谱运箅公式如下:
LMS自适应滤波
自适应滤波法是现代信号处理技术的重要组成部分,对复杂信号的处理具有独特的功能。自适应滤波器实现的复杂性通常用它所需的乘法次数和阶数来衡量,并调节滤波器系数以改进性能。
LMS算法采用n个权重不尽相同的自适应线性组合器来模拟真实的声音,假设理想信号为y(n),实际输出信号为d(n),那么误差信号可以表示为
式中:为组合器的权重矩阵;x(n)为n个组合器的信号矩阵。
运用最小均方误差准则,就是求使得最小时的W,因为是通过对其求导并令其等于0求得的,而在最小点不可导,所以采用。均方误差表示为:
代入d(n)的表达式,得:
式中:为n×n 的自相关矩阵,它是输入信号相关性矩阵;P = E[d(n)x(n)] 代表理想信号d(n)与输入矢量的相关性。
当最小时:
式中:为要求的最佳权系数。常见的两种系数求法是最陡梯度法和随机梯度法。
最陡梯度法的思路是先假设W(0),利用迭代公式计算。当W(n+1)和W(n)的误差小于目标值则认为迭代完成。随机梯度法的思路是用瞬时代替,此时迭代公式为:
式中μ是步长因子,满足,一般认为步长越大,收敛速度越慢。当d(n)≈ 0 或y(n)≈ 0 时可认为没有语音信号输入,可以不对这一段的语音信号数据进行处理。
分模块设计与实现
本次设计共分为三个模块进行实现,分别为谱减法处理、LMS自适应信号处理和DSP平台实现。
谱减法进行语音信号处理
基本谱减法
谱减法语音增强的算法流程如下图所示。
谱减法在频域将带噪语音的功率谱减去噪声的功率谱得到纯净语音功率谱估计,开方后就得到语音幅度谱估计,用带噪语音的相位来近似纯净语音的相位,再采用反傅里叶变换恢复时域信号。
基本谱减法的改进
如完整的谱减运算公式所示的基本谱减法对于整个语音段采用减去相同噪声功率谱的办法,这样,实际处理效果不是很理想,原因是,语音的能量往往集中在某些频段内,在这些频段内的幅度相对较高,尤其是共振峰处的幅度一般远大于噪声,因此,不应用同一标准处理。由上述分析可知,在谱减法中噪声功率谱的估计至关重要,如果噪声估计偏差较大的话,将毫无疑问地影响语音增强质量。可以采用基于语音端点检测技术来精确判断出每一帧的噪声,保证语音处理系统良好的性能。该方法可以综述为:从输入信号中提取一个或一系列的对比特征参数,然后将其和一个或一系列的门限阈值进行比较,如果超过门限则表示当前为有音段,否则就表示当前为无音段。门限通常是根据无音段时的语音特征确定的,这里采用了基于能零比的语音端
文档评论(0)