- 1、本文档共63页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
音频处理基础知识课件
第5讲 音频软件的使用;声音的发生条件; 频率:当声音在空气中传递,大气压力会循环变化。每一秒内压力变化的次数称为频率,量度单位是赫兹(Hz)。
;响度:人主观上感觉声音的大小,由振幅决定,振幅越大响度越大。单位为分贝(dB)
分贝:声源功率与基准声功率比值的对数乘以10
音调:声音的高低,由频率决定,频率越高音调越高。
人耳听力范围:16~20000Hz
音色:声音的特性,由发声物体本身材料、结构决定。
泛音:在基础音基础上产生的倍频振动;模拟信号与数字信号
数字域内对声音处理的优点
不受时间和环境变化影响
表示部件功能的数学运算容易实现
可以方便实现对数字运算部件的编程
数字化的概念;
均匀采样:连续时间的离散化通过采样来实现,就是每隔相等的时间采样一次
线性量化与非线性量化:连续幅度的离散化通过量化来实现,就是把信号的强度划分成段,如果幅度的划分是等间隔的,就称为线性量化,否则就称为非线性量化。
采样频率:每秒钟需要采集的声音样本数。
量化精度:每个声音样本的位数;
采样频率(sampling rate):是将模拟声音波形转换为数字时,每秒钟所抽取声波幅度样本的次数,单位是Hz(赫兹)。采样频率越高,等分波形的份数就越多,质量就越高。
采样定理
设采样信号的频率为fs,输入模拟信号的最高频率分量的频率为f max,则fs与f max必须满足下面的关系:
f s =2f max;采样精度(采样位数):是每个采样点能够表示的数据范围,经常采用的有8位、12位和16位。
位数:(也称量化级)是指声卡在采集和播放声音文件时,所使用的二进制位数范围大小。它反映了可用来采样的不同电压值的总数大小。位数越高采样越精确。
例如,8 位表示每个采样点可以表示256 个不同量化值,而16 位则可以表示65536 个不同的量化值。
信噪比:信号噪声比SNR
SNR=10×log(V2singal)/( V2noise)=20×log(Vsingal)/( Vnoise);使溢敖赛葡趟鼓烬稳五霉诞噎陛害贼讣鞋行推掩张拦菠切厚丙智翠贼蝴滔音频处理基础知识课件音频处理基础知识课件; 声音通道的个数,是指一次采样所记录的产生声音波形的个数。
单声道:记录声音时,每次生成一个声波数据。
双声道:记录声音时,每次生成两个声波数据。
准立体声:在录制声音的时候采用单声道,而放音有时是立体声,有时是单声道。
四声道环绕:规定了4个发音点:前左、前右,后左、后右,同时还建议增加一个低音音箱(即 4.1声道音箱系统),以加强对低频信号的回放处理。;5、声音质量与数据;数字音频的存储量(未经压缩的):; 用一组数字来描述的音频信号。
音频的数字化表示
模拟音频经过A/D 转换后,将模拟信号转换为数字信号,并输出到数字存储器中保存。
;采样序号;
声音文件(波形声音):通过声音录入和数字化采样设备获取的原始声音信息文件,它直接记录了真实声音的二进制采样数据,通常文件较大。
MIDI文件:一种音乐演奏指令序列,相当于乐谱,可以利用声音输出设备或与计算机相连的电子乐器进行演奏,MIDI文件由于不包含声音数据,其文件尺寸较小。; 1、WAV文件:又称为波形文件,文件的扩展名是“.wav”。是Windows系统上使用最广泛的音频文件格式。通常用于保存无压缩的音频信息,它可以重现各种声音,但产生的文件很大,多用于存储简短的声音片断。
2、VOC 文件:VOC文件是Creative公司所使用的标准音频文件格式,多用于保存 Creative Sound
Blaster(创新声霸)系列声卡所采集的声音数据,被Windows平台和DOS平台所支持。
VOC 文件也是一种数字声音文件,与波形文件相似,可以方便地互相转换。;3、MPEG音频文件——.MP1/.MP2/.MP3 :
这里的音频文件格式指的是MPEG标准中的音频部分,即MPEG音频层(MPEG Audio Layer)。MPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为三层(MPEG Audio Layer 1/2/3),分别对应MP1、MP2和MP3这三种声音文件;
MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为4∶1和6∶1~8∶1,而MP3的压缩率则高达10∶1~12∶1,也就是说一分钟CD音质的音乐,未经压缩需要10MB存储空间,而经过MP3压缩编码后只有1MB左右,同时其音质基本保持不失真。;4、RealAudio文件——.RA/.RM/.RAM
RealAudio文件是RealNetwor
文档评论(0)