- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
5.5 语音识别技术及应用 5.5.1 语音识别的基本原理及过程 5.5 语音识别技术及应用 5.5.2 文本—语音转换技术 5.5.3 语音识别软件(ViaVoice) 目录 * 第五章 多媒体音频技术 第5章 多媒体音频技术 音频概述 声音的数字化 Audition音频处理软件 MIDI与音乐合成 语音识别技术及应用 5.1 音频基础 5.1.1 声音的基本概念 声音在物理学上称之为声波,是通过一定介质(如空气、水等)传播的连续的振动的波。 声波引起某处媒质压强的变化量称为该处的声压。 声音的强弱体现在声波的振幅上 音调的高低体现在声波的周期和频率上。 5.1.1 声音的基本概念 声波是随时间连续变化的物理量,它有3个重要指标: 振幅——波的高低幅度,表示声音的强弱; 周期——两个相邻波之间的时间长度; 频率——每秒振动的次数,以Hz为单位。 振 幅 周 期 基 线 1.声音如何传播 声音依靠介质的振动进行传播。 声源实际上是一个振动源,它使周围的介质(空气、液体、固体)产生振动,并以波的形式进行传播。 声源的形式多样,例如,吉他、人的声带、农村的拖拉机等。 声源振动,通过它周围的空气、水等传播介质进行传播,形成“声波”。 人耳接收到声波,耳膜随之振动,再通过听觉神经末梢的传递,就可以听见声音。 2.声音的频率 声源每秒振动的次数称为该声源的“频率”。 用音频来表示声音信号的频率,单位为赫兹(Hz)。 频率对于声音来说是个非常重要的概念,不同的声音有不同的频率范围,人耳只能听到频率范围在20Hz~20kHz之间的声音,低于20Hz的次声和高于20kHz的超声都听不到。 次声波 可听声波 超声波 20Hz 20kHz f(Hz) 人耳对不同频率的敏感程度有很大差别 对中频段(2 kHz~4 kHz)最为敏感,幅度很低的信号都能被人耳听到; 对低频区和高频区较不敏感,能被人耳听到的信号幅度比中频段要高得多。 10 20 50 200 3.4k 7k 15k 20k CD-DA FM广播 AM广播 电话 f(Hz) 3.声音的传播方向 当辐射出来的声波波长比声源的尺寸大时,声波比较均匀地向各方向传播; 当辐射出来的声波波长小于声源的尺寸时,声波集中地向正前方一个尖锐的圆锥体范围内传播。 4.声音的三要素 声音效果的三要素:音调、音强、音色。 音调:指声音的高低。音调的高低,主要取决于声波频率的高低。频率越高,音调越高,反之亦然。 在使用音频处理软件对声音的频率进行调整时,其音调也会随之产生变化。例如,男子发音,其频率约在90~140Hz之间,其音调较低;女子发音的频率约在270~550Hz之间,其音调较高。 音强:是指声音的强度,又称声音的响度,由声波振动的振幅决定。它是人耳感受到的声音强弱,是人对声音大小的一个主观感觉量。 音色:即声音的品质,它由泛音的多少、泛音的频率和振幅决定。例如,不同的乐器在基本振动频率相同的情况下,仍然可以区分各自的特色,就是因为它的音色不同。 5.音质 “音质”是声音的质量,音质的好坏与音色的频率范围有关。 影响音质的因素 对于数字音频信号,音质的好坏与数据采样频率和数据位数有关。 音质与声音还原设备有关。 音质与信号噪声比有关。 5.1.2 音频素材的获取 自行录制 Windows自带的录音机 (Sound Recorder) 从素材库或网站中获取 从CD、VCD等媒体中获取 目录 5.2 声音的数字化 采样频率 在某个特定的时刻对模拟信号进行测量叫做采样。采样频率也称取样频率,是指在单位时间(1s)内采样的次数。 采样 量化 声音的模拟信号 声音的数字信号 编码 5.1.2 数字化过程 5.2 声音的数字化 量化位数 量化是将经过采样得到的离散数据转换成二进制数的过程。量化位数,即分辨率,是指将经过采样得到的离散数据转换成二进制数的位数,一般为32、16、8、4位。 声道数 声音通道的个数称为声道数,是指一次采样所记录产生的声音波形个数。声道有单声道和立体声之分。 5.2.2 数字音频压缩标准 1 音频压缩方法概述 音频压缩方法是指对原始数字音频信号流(PCM编码)运用适当的数字信号处理技术,在不损失有用信息量,或者所引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。逆变换的过程,称为解压缩或解码。 输入音频信号 输出音频信号 编码器 传输/存储 解码器 5.2.2 数字音频压缩标准 2.音频压缩技术标准 目录 .rm ● RA(RealAudio) Real音频文件 主要适用于在网络上的在线音乐欣赏
您可能关注的文档
- 第3章_消费税法--2012-10案例.ppt
- 第3章+词法案例.ppt
- 第3章+国际金融市场案例.ppt
- 第3章+金融机构体系案例.ppt
- 第5章城市道路横断面规划设计案例.ppt
- 第3章2TTL反相器案例.ppt
- 第一节电动机的基本控制电路介绍.ppt
- 第5章传输线理论1案例.ppt
- 第3章80x86寻址方式与指令系统案例.ppt
- 第一节电流与电压和电阻的关系介绍.ppt
- 人教版九年级英语全一册单元速记•巧练Unit13【速记清单】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit9【速记清单】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit11【速记清单】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit14【单元测试·提升卷】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit8【速记清单】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit4【单元测试·提升卷】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit13【单元测试·基础卷】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit7【速记清单】(原卷版+解析).docx
- 苏教版五年级上册数学分层作业设计 2.2 三角形的面积(附答案).docx
- 人教版九年级英语全一册单元速记•巧练Unit12【单元测试·基础卷】(原卷版+解析).docx
最近下载
- 空调主机吊装方案.docx
- 基层儿科医务人员服务能力提升学习班答案-2024华医网继续教育答案.docx VIP
- 部编 人教版小学二年级上册语文教学课件 5.课文 14.我要的是葫芦 .pptx VIP
- 让“工具包”理念和方法落地.pdf VIP
- 国家开放大学《可编程控制器应用实训》形考任务2(实训二)参考答案.docx
- 4.2 实现中华民族伟大复兴的中国梦 课件(18张PPT)-2023-2024学年高中政治统编版必修一中国特色社会主义.pptx VIP
- 费森尤斯CRRT操作流程.doc VIP
- 五年级上册英语期中试卷人教精通版.pdf VIP
- 第17课昆明的雨(课件)(共27张PPT).pptx VIP
- 小学信息技术(信息科技)第六册泰山版(2018)合集.docx
文档评论(0)