[发明专利]一种声纹识别性能提升方法、装置、终端及存储介质在审
申请号: | 201710741564.4 | 申请日: | 2017-08-25 |
公开(公告)号: | CN107331400A | 公开(公告)日: | 2017-11-07 |
发明(设计)人: | 高聪 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L17/14 | 分类号: | G10L17/14;G10L17/22;G10L15/22;G10L15/18 |
代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声纹 识别 性能 提升 方法 装置 终端 存储 介质 | ||
技术领域
本发明实施例涉及声纹识别技术领域,尤其涉及一种声纹识别性能提升方法、装置、终端及存储介质。
背景技术
声纹识别技术属于生物识别技术的一种,是一项根据语音中反应说话人生理和行为特征的语音参数来识别语音话者身份的技术。由于每个人的发声器官在尺寸和形态方面不尽相同,因此声纹也就成为一种鉴别说话人身份的识别手段。
随着语音识别技术的快速发展,越来越多的智能电器设备采用声纹识别技术来增强用户的用户体验,用户可以根据声纹识别技术锁定个人账户,并对个人账户进行私人属性定义,因此用户可以使用语音快速进入设备系统并获取个人账户信息及功能。因此,声纹识别的准确度十分关键。
发明内容
本发明实施例提供了一种声纹识别性能提升方法、装置、终端及存储介质,能够增加语音样本量,提高声纹识别的准确性,增强用户体验。
第一方面,本发明实施例提供了一种声纹识别性能提升方法,包括:
获取用户输入的语音开启指令;
确定所述语音开启指令与预设的引导文本是否匹配;
若匹配,则提取所述语音开启指令对应的声纹特征;
将提取的所述声纹特征与预先确定的样本声纹特征进行匹配,若匹配成功,则执行开启操作,其中所述样本声纹特征是从语义为所述引导文本的语音信息中预先提取的。
第二方面,本发明实施例提供了一种声纹识别性能提升装置,包括:
语音指令获取模块,用于获取用户输入的语音开启指令;
语音识别模块,用于确定所述语音开启指令与预设的引导文本是否匹配;
声纹特征提取模块,用于当所述语音开启指令与预设的引导文本匹配时,提取所述语音开启指令对应的声纹特征;
声纹特征匹配模块,用于将提取的所述声纹特征与预先确定的样本声纹特征进行匹配,若匹配成功,则执行开启操作,其中所述样本声纹特征是从语义为所述引导文本的语音信息中预先提取的。
第三方面,本发明实施例提供了一种终端,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的声纹识别性能提升方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所述的声纹识别性能提升方法。
本发明实施例提供的一种声纹识别性能提升方法、装置、终端及存储介质,通过获取用户输入的个性化引导语音,依据用户的个性化引导语音提取得到用户的样本声纹特征,并依据样本声纹特征对语音开启指令对应的声纹特征进行匹配。由于引导文本的内容可以由用户自行设定,个性化引导语音提升了容错机制,提高了声纹识别的准确度,从而提高了样本声纹特征的准确度,相应地,提高了后续声纹特征匹配的准确度,提升了用户体验。
附图说明
图1为本发明实施例一提供的一种声纹识别性能提升方法的流程图;
图2为本发明实施例二提供的一种声纹识别性能提升方法的流程图;
图3为本发明实施例三提供的一种声纹识别性能提升装置的结构示意图;
图4为本发明实施例四提供的一种终端的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种声纹识别性能提升方法的流程图,本实施例可适用于通过语音指令控制智能设备的情况,该方法可以由声纹识别性能提升装置来执行,该声纹识别性能提升装置可以采用软件和/或硬件的方式实现。参考图1,该方法具体可以包括如下:
S110、获取用户输入的语音开启指令。
智能终端可以对周围环境进行实时检测,处于休眠状态的智能终端检测到所处环境有语音指令时,获取用户输入的语音开启指令。智能终端是支持语音交互的具有多媒体功能的智能设备,如具有支持音频、视频、数据等方面的功能,可以是智能机器人,智能音箱等。
S120、确定语音开启指令与预设的引导文本是否匹配;若匹配,则继续执行S130;否则,跳转执行S160。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710741564.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种学习效果检测方法、系统及终端设备
- 下一篇:广播终端及广播内容的播放方法