第四章数字音频处理技术.pptVIP

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章 数字音频处理技术 本章重点: 声音概述 音乐合成与MIDI 数字音频压缩标准 数字音频处理实例 声音在本质上是一种机械振动,它通过空气传播到人耳,刺激神经后使大脑产生一种感觉。在一些专业场合,声音通常被称为声波或音频。 4.1 声音概述 声音在物理学上称之为声波,是通过一定介质(如空气、水等)传播的一种连续振动的波,也称为声波。 通常把频率范围为20Hz~20kHz的信号称为音频信号。低于20Hz的信号为亚音信号或者称为次音信号;高于20kHz的信号称为超音频信号,或称为超声波信号。 常见声源及其频率范围: 声音的特征: 声音有3个重要指标即振幅、周期和频率。振幅是波的高低幅度,表示声音的强弱;周期指两个相邻波之间的时间长度;频率指每秒振动的次数,以Hz为单位。 声音的3要素是音调、音色、强度,它们分别与声波的频率、波形、振幅等相关 4.2 数字化音频 声音信号是时间和幅度上都连续的模拟信号。而计算机只认识“0”和“1”,或者说计算机只能处理一个个数据,尽管数据量可能是巨大的。所以,计算机处理声音的第一步是将声音数字化,将模拟信号变为数字信号。 4.2.1音频的数字化 把模拟声音(音频)信号转换位数字化声音(音频)的过程称为声音(音频)的数字化,或称为模/数(A/D)变换。 1. 采样 在音频数字化过程中,采样指的是以固定的时间间隔T对模拟信号(音频信号)进行取值。固定的时间间隔T称为采样周期,1/T称为采样频率(fs)。采样后得到的是一个离散时间信号。采样时间间隔T越短,也就是采样频率越高,声音数据在后期播放时保真度越好。 2. 量化 采样后的音频信号需要经过量化,使信号幅度转变为有限的离散数值。这种由有限个数值组成的信号就称为离散幅度信号。 例如,假设输入电压的范围是0V~7V,并假设它的取值只限定在0,1,2,…,7共8个值。如果采样得到的幅度值是1.2V,则它的取值就应是1V,如果采样得到的幅度值是2.6V,则它的取值就应是3V等。 这种数值就称为离散数值,即量化值。量化之后得到的是时间离散、幅度离散的数字信号。 3. 编码 编码,即是将量化值表示成为二进制数的形式,以便于计算机存储和处理。例如,上面量化规定的8个取值,就可以用3位二进制数表示,从000~111,2V可以表示为001,3V可以表示位011,6V可以表示位101。 计算机可以对数字化之后的音频信号进行存储、编辑和处理,并可以还原成原始的波形进行播放,这个还原的过程称为解码,它是模/数(A/D)变换的逆过程,及数/模(D/A)变换。 4.2.2 数字音频音质与数据量 采样频率和采样量化级数是数字化声音的两个最基本要求,直接影响数字化音频的质量和数据量。一般而言,采样频率越高声音失真越小,但用于存储音频的数据量也越大。量化位数越高音质越好,数据量越大。 通常有3中采样频率:44.1kHz(取样44 100次每秒,用于CD品质的音乐)、22.05kHz(适用于语音和中等品质的音乐)、11.025kHz(低品质),量化精度分别为8位字长(256阶)量化(低品质)和16位字长(65 535阶)量化(高品质)。 4.2.2 数字音频音质与数据量 反映音频数字化质量的另一个因素是通道(或声道)个数。一次采样一个声音波形,称为“单声道”;一次采样两个声音波形,称为“双声道”(即人们常说的立体声)。立体声更能反映人的听觉感受。但数据量比单声道多一倍,这样需要的存储空间是单声道的两倍。对声音的采样可以使用不同的采样频率、采样量化级数和声道,但实际上为了节省存储空间,经常要在数字化音频数据量的的大小与声音回放质量之间进行权衡。 音质与数字音频参数的关系 4.2.3 数字音频文件格式 数字音频数据是以文件的形式保存在计算机中的。数字音频的文件格式主要又CD、WAVE、MP3、WMA、MIDI等。 CD文件:*.cda格式,采用44.1kHz的采样频率,速率为88kbps。具有16位量化位数,CD音轨近似无损,声音基本上终于忠于原声。 WAV文件:微软公司开发的一种声音文件格式,也称波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。 4.2.3 数字音频文件格式 MP3音频文件:全称为MPEG-1 audio layer3,其压缩率为12:1。优势是在高压缩比的情况下,还能拥有优美的音质。它利用知觉音频编码技术,即利用了人耳的特性,消减音乐中人耳的特性,消减音乐中人耳听不到的成分,同时尽可

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档