SJT 11380-2008自动声纹识别(说话人识别)技术规范.pdf

SJT 11380-2008自动声纹识别(说话人识别)技术规范.pdf

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1CS 35. 040L 71SJ备案号:23323-2008中华人民共和国电子行业标准SJ/T 11380—-2008自动声纹识别(说话人识别)技术规范Technology specification for automatic voiceprint recognition (speakerrecognition)2008-03-10 发布2008-03-10实施中华人民共和国信息产业部发布SJ11200 SJ/T 11380—2008目次前言1 范围.2 规范性引用文件。专量专中营中心心心合#心3 术语与定义4数据交换格式4.1概述..4.2通用操作.4.3语音操作..8量业量门中中中中电中电心eeeeeeop94.4模型与模型集操作.4.5声纹模型训练..9中·中#中中中中中手华中.104.6声纹确认4.7声纹辨认104.8声纹检出..11114.9声纹追踪.#中办中心 (规范性附录)VPR-API v1.0 函数定义...13附录 A SJ/T 11380—2008言前请注意本标准的某些内容有可能涉及专利。本标准的发布机构不应承担识别这些专利的责任。本标准的附录A是规范性附录。本标准由全国信息技术标准化技术委员会归口。本标准由北京得意音通技术有限责任公司、清华大学智能技术与系统国家重点实验室(语音技术中心)、中国电子技术标准化研究所负责起草。本标准主要起草人:郑方、宋战江、徐明星、吴畏、邓菁、吴志刚。II SJ/T 11380--2008自动声纹识别(说话人识别)技术规范1范围本标准规定了声纹识别(系统)的术语与定义、数据交换格式与应用编程接口(VPR-API1.0)。本标准适用于各种计算机、网络和智能设备配置的声纹识别系统。2规范性引用文件下列文件中的条款通过本标准的引用而成为标准的察款,凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修还版均不适用手本标难,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最薪版本适用于本标准。GB12200.1-1990汉语信息处理词汇 01部分:基本术语C语言文字规范=汉语拼音方案的通用键盘表示规范GF 3006-2001店M3 术语与定义.下列术语和定义适用于本标准。3.1声纹识别的基本概念3.1.1声纹voiceprint特征,以及基于这些特征(参数)所建立的语音模对语音中所蕴含的、能表征和标识说话人的语音特B型的总称。3.1.2L声纹特征vaioeprint feature说话人特征 speaker featureGa从说话人的语音中所提取出来的、可以表征该说话人语音的个性特征的参数。注:常用的特征参数包括频谱(spectrum)、倒频谱(cepstrum)、线性预测系数(LpC)鲁高(pitch)、声调(tone)、共振峰(formant)、音质(voice,qality)声韵(prasody)、习语(phoneme/word idiolect)等各种层次的信L息。3.1.3声纹模型voiceprint model说话人模型speaker model对声纹特征进行描述的数学模型。注:常用的数学模型有:高斯混合模型(Gaussian mixture model),基于通用背景模型的高斯混合模型(Gaussianmixture model-universal background model),隐马尔可夫模型(hidden Markov model),人工神经网络(artificial neural network),支持向量机(support vector machine)等。通常,一个声纹模型对应一名说话人,但一名说话人可以有多个声纹模型,以对应各种不同的应用环境或声纹信息层次,如一名说话人可以在不同的信道条件下有不同的声纹模型。3.1.4声纹模型训练 voiceprint model training说话人模型训练speaker model training1 SJ/T 11380—2008说话人注册speaker enrollment从说话人的语音提取声纹特征并根据声纹特征估计其声纹模型的参数的过程。注:说话人一旦经过声纹训练并把其声纹模型的模型参数记录下来,即可在将来用于与未知说话人的语音进行声纹比对,从而辩认或确认该段语音所对应的说话人的身份。在不致混淆的情况下,该术语可简称为“声纹训练”或“说话人训练“3.1.5声纹模型自适应 voiceprint model adaptation说话人模型自适应speaker model adaptation利用新采集到的语音数据对其已有声纹模型的参数进行重新估计的过程。注:对已经建立声纹模型的说话人,当其年龄、情绪、说话环境等发生变化时原声纹模型的参数可能无法很好地

文档评论(0)

consult + 关注
官方认证
内容提供者

consult

认证主体山东持舟信息技术有限公司
IP属地山东
统一社会信用代码/组织机构代码
91370100MA3QHFRK5E

1亿VIP精品文档

相关文档