语音识别技术论文.pdfVIP

下载本文档

0
0
约4.47千字
约 6页
2024-09-01 发布于河南
举报
版权申诉

语音识别技术论文.pdf

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

摘要：语音识别技术是一门涉及面很广的交叉学科。随着新理论的提出和应用，语音识别

技术取得了很大的进步,许多产品已经得以实际的应用，但在其进一步的发展进程中，还有

许多棘手的问题有待解决。

关键词：语音识别；动态时间规整算法；人工神经元网络

1背景介绍

语言是人类特有的功能,是人们思维最重要的寄托体，是人类交流最主要的途径。语音

是语言的声学表现，是人类交流信息最自然、最有效、最方便的手段。语言和语音与人类

社会科学文化发展紧密相连。

语音识别技术是让机器接收，识别和理解语音信号，并将其转换成相应的数字信号的

技术。它是一门交叉学科，涉及到语音语言学、数理统计、计算机、信号处理等一系列学

科。

2发展历史

1952年贝尔实验室的Davis等人研制成功了能识别十个英文数字发音的Audry系统，

标志着语音识别技术研究工作开始。20世纪60年代计提出了动态规划(Dynamic

programming)和线性预测分析技术（LinerPredictive）等重要成果。20世纪70年代，

语音识别领域取得了突破。实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别

系统。20世纪80年代语音识别研究进一步走向深入,基于特定人孤立语音技术的系统研

制成功,隐马尔可夫模型和人工神经元网络(ArtificialNeuralNetwork)在语音识别中的成

功应用。进入20世纪90年代后语音识别系统开始从实验室走向实用。我国对语音识别的

研究开始于20世纪80年代，近年来发展迅速，并取得了一系列的成果。

3具体应用

随着计算机技术、模式识别等技术的发展，适应不同场合的语音识别系统相继被开发

出来，语音识别及处理技术已经越来越突现出其强大的技术优势。近三十年来，语音识别

在计算机、信息处理、通信与电子系统、自动控制等领域的应用越来越广泛。

在许多政府部门、商业机构，语音识别技术的应用，可免除大量操作人员的重复劳动，

既经济又方便。如：语音邮件、IP电话和IP传真、电子商务、自动语音应答系统、自动

语音信箱、基于IP的语音、数据、视频的CTI系统、综合语音、数据服务系统、自然语音

识别系统、专家咨询信息服务系统、寻呼服务、故障服务、秘书服务、多媒体综合信息服

务、专业特别服务号(168自动信息服务系统，112、114、119等信息查询系统)等。许多

特定环境下，如工业控制方面，在一些工作环境恶劣、对人身有伤害的地方(如地下、深水

及辐射、高温等)或手工难以操作的地方，均可通过语音发出相应的控制命令，让设备完成

各种工作。

当今，语音识别产品不仅在人机交互中，占到的市场比例越来越大，而且在许多领域

都有了广阔的应用前景，在人们的社会生活中起着举足轻重的作用。

4语音识别系统原理

语音识别一般分为两个步骤：学习阶段和识别阶段。学习阶段的任务是建立识别基本

单元的声学模型以及语言模型。识别阶段是将输入的目标语音的特征参数和模型进行比较，

得到识别结果。

语音识别过程如图所示。下面对该流程作简单介绍：

（1）语音采集设备如话筒、电话等将语音转换成模拟信号。

（2）数字化一般包括预滤波、采样和A/D变换。该过程将模拟信号转变成计算机能

处理的数字信号。

（3）预处理一般包括预加重、加窗分帧。经预处理后的信号被转换成了帧序列的加

窗的短时信号。

（4）参数分析是对短时信号进行分析，提取语音特征参数的过程，如时域、频域分

析，矢量量化等。

（5）语音识别是目标语音根据特征参数与模型库中的参数进行匹配，产生识别结果

的过程。一般有模板匹配法、随机模型法和神经网络等。

（6）应用程序根据识别结果产程预定动作。

（7）该过程是语音模型的学习过程。

5现有算法介绍

语音识别常用的方法有：模板匹配法、人工神经网络法。

（1）模板匹配法是语音识别中常用的一种相似度计算方法。模板匹配法一般将语音

或单词作为识别单元，一般适用于词汇表较小的场合。在训练阶段，对用户语音进行特征

提取和特征维数

您可能关注的文档

文档评论（0）

185****4797 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

语音识别技术论文.pdfVIP