[发明专利]基于多特征匹配的声纹识别方法及装置在审
申请号: | 202110344550.5 | 申请日: | 2021-03-29 |
公开(公告)号: | CN113192513A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 杭州鹿扬科技有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L21/0272;G10L25/63 |
代理公司: | 北京国翰知识产权代理事务所(普通合伙) 11696 | 代理人: | 张天辰 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 匹配 声纹 识别 方法 装置 | ||
本发明公开了基于多特征匹配的声纹识别方法及装置,属于语音识别技术领域,本发明的基于多特征匹配的声纹识别方法,对采集待识别的声音数据,提取声音数据的声纹,生成声纹的波形,基于生成的声纹的波形,对声纹进行噪声分离等操作,实现了将采集到的声音数据转换为声纹,对声纹进行噪声分离,再对声音声纹波形分别进行情绪空间映射和识别空间映射,分别在两个空间下得到情绪特征和识别特征,再根据情绪特征和识别特征进行识别,在识别过程中,使用窗函数的方式进行相似部分识别,多特征的识别显著提升了识别的准确率。
技术领域
本发明属于语音识别技术领域,具体涉及基于多特征匹配的声纹识别方法及装置。
背景技术
语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
根据识别的对象不同,语音识别任务大体可分为3类,即孤立词识别(isolatedword recognition),关键词识别(或称关键词检出,keyword spotting)和连续语音识别。其中,孤立词识别的任务是识别事先已知的孤立的词,如“开机”、“关机”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或一段话;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现,如在一段话中检测“计算机”、“世界”这两个词。
根据针对的发音人,可以把语音识别技术分为特定人语音识别和非特定人语音识别,前者只能识别一个或几个人的语音,而后者则可以被任何人使用。显然,非特定人语音识别系统更符合实际需要,但它要比针对特定人的识别困难得多。
另外,根据语音设备和通道,可以分为桌面(PC)语音识别、电话语音识别和嵌入式设备(手机、PDA等)语音识别。不同的采集通道会使人的发音的声学特性发生变形,因此需要构造各自的识别系统。
发明内容
本发明的主要目的在于提供基于多特征匹配的声纹识别方法及装置,其将采集到的声音数据转换为声纹,对声纹进行噪声分离,再对声音声纹波形分别进行情绪空间映射和识别空间映射,分别在两个空间下得到情绪特征和识别特征,再根据情绪特征和识别特征进行识别,在识别过程中,使用窗函数的方式进行相似部分识别,多特征的识别显著提升了识别的准确率。
为达到上述目的,本发明的技术方案是这样实现的:
基于多特征匹配的声纹识别方法,所述方法执行以下步骤:
步骤1:采集待识别的声音数据,提取声音数据的声纹,生成声纹的波形,基于生成的声纹的波形,对声纹进行噪声分离;得到声音区间对应的声音声纹波形;
步骤2:对声音声纹波形进行基于情绪空间的波形映射,得到情绪空间下的情绪映射波形;再对声音声纹波形进行基于识别空间的波形映射,得到识别空间下的识别映射声纹波形;
步骤3:基于情绪映射波形进行第一次特征分析,得到声音声纹波形的情绪特征;基于识别映射波形进行第二次特征分析,得到声音声纹波形的识别特征;
步骤4:将识别特征和情绪特征进行特征融合,以得到声纹波形融合后的特征,将该特征作为待识别目标;
步骤5:对待识别目标进行基于分帧处理,以得到声纹波形融合后的特征的每一音帧的特征;使用两个识别样本对分帧处理后的待识别目标进行匹配识别,通过匹配识别得到相似部分;
步骤6:在两个样本中找到相似部分分别对应的内容,对内容取加权平均,完成相似部分的识别;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州鹿扬科技有限公司,未经杭州鹿扬科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110344550.5/2.html,转载请声明来源钻瓜专利网。