一种改进的DNN-HMM的语音识别方法-应用声学.PDF

一种改进的DNN-HMM的语音识别方法-应用声学.PDF

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 38 卷 第3 期 Vol. 38, No. 3 2019 年 5 月 Journal of Applied Acoustics May, 2019 ⋄ 研究报告⋄ 一种改进的DNN-HMM 的语音识别方法 李云红 梁思程 贾凯莉 张秋铭 宋 鹏 何 琛 王刚毅 李禹萱 (1 西安工程大学电子信息学院 西安 710048) (2 国网西安供电公司 西安 710032) 摘要 针对深度神经网络与隐马尔可夫模型(DNN-HMM) 结合的声学模型在语音识别过程中建模能力有 限等问题,提出了一种改进的DNN-HMM 模型语音识别算法。首先根据深度置信网络(DBN) 结合深度玻 尔兹曼机(DBM),建立深度神经网络声学模型,然后提取梅尔频率倒谱系数(MFCC) 和对数域的Mel 滤波 器组系数(Fbank) 作为声学特征参数,通过TIMIT 语音数据集进行实验。实验结果表明:结合了DBM 的 DNN-HMM 模型相比DNN-HMM 模型更具优势,其中,使用MFCC 声学特征在词错误率与句错误率方面分 别下降了1.26% 和0.20% 。此外,使用默认滤波器组的Fbank 特征在词错误率与句错误率方面分别下降了 0.48% 和0.82%,并且适量增加滤波器组可以降低错误率。总之,研究取得句错误率与词错误率分别降低到 21.06% 和3.12% 的好成绩。 关键词 语音识别,深度神经网络,声学模型,声学特征 中图法分类号: TN912.34 文献标识码: A 文章编号: 1000-310X(2019)03-0371-07 DOI: 10.11684/j.issn.1000-310X.2019.03.012 An improved speech recognition method based on DNN-HMM model LI Yunhong LIANG Sicheng JIA Kaili ZHANG Qiuming SONG Peng HE Chen WANG Gangyi LI Yuxuan ( School of Electronics and Information, Xi’an Polytechnic University, Xi’an , China) ( State Grid Xi’an Power Supply Company, Xi’an , China) Abstract The acoustic model combined with deep neural network and hidden Markov model (DNN-HMM) has been used extensively in today’s speech recognition system. In this paper, an improved DNN-HMM model speech recognition algorithm is proposed. First, a deep neural network acoustic model is built by the deep belief network (DBN) and the deep Boltzmann machine (DBM). Then the Mel freque

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档