语音信号的压缩与重构.docxVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信号的压缩与重构 1 压缩感知cs技术 说话人识别技术是一种基于语音波形的参数来代表说话人特征的参数,并通过认证说话人的身份。在众多的生物认证技术中,说话人识别技术以其独特的方便性和经济性而受到广泛关注,并日益成为人们日常生活和工作中重要且普及的安全认证方式。当前的说话人识别系统在实验室环境下大多都可以获得较高的识别率,但实际应用中的噪声污染,将导致系统识别性能的大幅度下降。如何提高噪声环境下系统的鲁棒性是当前说话人识别领域的热点之一。本文将信号处理领域国际研究热点压缩感知CS(Compressed Sensing)技术,应用于说话人识别领域来提高系统的抗噪性能。 压缩感知理论[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17]是近年来针对稀疏信号提出的一种压缩方法,它实现了对未知信号的边感知边压缩,并且采样数据远远小于奈奎斯特采样定律要求的数据量。由于数据量减少,并且在一定条件下,采样数据可以精确重构原信号,所以该技术已经在传感器网络、信号的检测,估计和分类、图像、医学、雷达、通信、模式识别、盲源分离和频谱分析等领域成为研究热点。本文研究了语音信号进行压缩感知处理时重构误差与观测点数的关系,并针对压缩感知重构信号频谱在噪声环境下变化较小的特性,提出一种新的基于压缩感知重构信号的说话人识别系统抗噪方法,研究了不同信噪比环境下获得最高识别性能时观测矢量的最佳点数。 2 稀疏域基cs理论 传统的奈奎斯特采样理论告诉我们要使信号采样后能够不失真还原,采样频率至少为信号最高频率的两倍。近几年压缩感知理论的研究表明,如果原始信号(例如语音信号)在某个基上具有稀疏性,那么采样率可以大大下降,并且在满足观测矩阵与变换基的非连贯条件以及信号重构的RIP(Restricted Isometry Property)条件时能够精确重构原信号。而且,CS理论打破了传统压缩编码的先抽样后压缩的处理方式,它对原始信号同时进行抽样和压缩。 假设原始信号x0∈Rn在正交基Ψ={yi|yi∈Rn?i=1?2???n}Ψ={yi|yi∈Rn?i=1?2???n}上是k-稀疏的,即 x0=Ψθ(1) 其中稀疏系数向量θ=ΨTx0=(θ1,θ2,…,θn)T只有k个非零系数,即‖θ‖0=k。 CS理论将k-稀疏信号x0随机投影到观测矩阵Φ上,由此产生了m个观测值y=(y1,y2,…,ym)T,即 y=Φx0=ΦΨθ=θ(2) 其中Φ=(φ1,φ2,…,φn),(φi∈Rm,i=1,2,…n)。Φ与Ψ互相不连贯。=ΦΨ称为CS矩阵。 通常观测向量的维数要远远小于原始信号的维数(m<n),于是可将观测向量y看作原始信号抽样和压缩后的结果。解压缩时,根据观测向量,CS理论应用数学优化方法来重构原始信号。 由y重构x0或θ时需要求解式(2),当m<n时,它有无穷多个解,所以,由式(2)无法求得确切的重构信号。但根据BP(Basis Pursuit)算法:因为θ为稀疏向量,式(2)可转化如下的l0最优化问题 minθ∥θ∥0subject toy=ΦΨθ=θ(3) 其中‖·‖0是对θ的一种稀疏性度量。因为(3)是NP(Non-Deterministic Polynomial)问题,可通过求解l1最优化问题得到它的等价解: minθ∥θ∥1subject toy=ΦΨθ=θ(4) 文献证明了l0和l1最优化问题的稀疏解的等价性。 由此可见,CS理论的关键是稀疏域基(对应稀疏系数)、观测矩阵和重构算法的选取。在我们的实验研究中,参考文献中的方法,对信号进行离散余弦变换DCT(Discrete Cosine Transform)得到其稀疏系数,选择随机高斯矩阵作为观测矩阵,并采用线性规划LP(Linear Program)中的单纯形(Simplex)方法进行信号的重构。 2.1 稀疏系数的获取 语音信号在DCT域上具有稀疏性,并且DCT域得到的系数是实系数,运算比较方便。具体如下 X(k)=n-1∑i=01√nx(i)?k=0 X(k)=n-1∑i=0√2nx(i)cos(2i+1)kπ2n?k=1?2??n-1(5) 本文通过DCT获取语音的稀疏系数θ=(θ1,θ2,…,θn)T,其中 θi=X(i-1),i=1,2,…,n。 2.2 rypeti条件 当观测矩阵Φ为高斯随机矩阵时可以满足Φ、Ψ的非连贯条件以及信号重构的RIP(Restricted Isometry Property)条件:即对特定ε≤0,任何k-稀疏矢量ν,有 1-ε≤‖ν‖2‖ν‖2≤1+ε(6) 所以实验中采用高斯随机矩阵作为观测矩阵。矩阵中的元素采用独立同分布iid(independent and identically distributed) 的高斯随机变量,即

文档评论(0)

hzyacc + 关注
实名认证
文档贡献者

专业的文档设计与制作

1亿VIP精品文档

相关文档