语音数据采集.pptx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

主讲:张群慧语音处理技术SpeechProcessingTechnology

01模块1语音数据处理--数据采集--

任务目标掌握什么是语音数据了解语音数据的格式语音数据的采集平台及方法了解数据采集标注平台

任务内容何为语音数据语音数据就是声音?语音数据带上标签的声音数据。涉及到标注—有专业的平台这算不算语音数据?

任务内容语音文件的格式语音文件的格式无损格式,例如WAV,FLAC,APE,ALAC,WavPack(WV)无损的音频格式(例如FLAC)压缩比大约是2:1,解压时不会产生数据/质量上的损失,解压产生的数据与未压缩的数据完全相同。如需要保证音乐的原始质量,应当选择无损音频编解码器。例如,用免费的FLAC无损音频编解码器你可以在一张DVD-R碟上存储相当于20张CD的音乐。有损格式,例如MP3,AAC,OggVorbis,Opus有损文件格式是基于声学心理学的模型,除去人类很难或根本听不到的声音。例如:一个音量很高的声音后面紧跟着一个音量很低的声音。MP3就属于这一类文件。

任务内容数字音频文件格式与接口标准语音文件的格式数字化音频格式的出现,是为了满足复制、存储、传输的需要。其常用的数字音频格式主要有:WAV文件、VOC文件和MP3文件等。WAV文件WAV文件支持多种音频位数、采样频率和声道,是PC机上最为流行的声音文件格式,但其文件尺寸较大,多用于存储简短的声音片段。WAV文件的存储量(KB)=(采样频率KHZ*采样位数bit*声道数*时间秒)/8

任务内容语音数据采集平台介绍语音数据采集平台介绍数据采集就是采集有用的数据。语音数据采集的基本过程如下:

任务内容语音数据采集平台介绍语音数据采集平台介绍相关的采集平台主要包括:云测数据、百度数据众包平台、magicdata、basicfinder、腾讯云数据标注

任务内容语音数据采集平台介绍业界领先的智能优化AB测试引擎MagicData?

谢谢大家Thankeveryone

文档评论(0)

学海无涯苦做舟 + 关注
实名认证
内容提供者

职业教育

1亿VIP精品文档

相关文档