[发明专利]基于说话者识别的语音识别方法和装置有效
申请号: | 201780052734.6 | 申请日: | 2017-08-24 |
公开(公告)号: | CN109643549B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 曹根硕;安桐薰;朴致衍;韩英浩;李在原 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L17/00;G06F3/16 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张婧 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 说话 识别 语音 方法 装置 | ||
提供了一种基于说话者识别来识别语音并输出语音识别结果的语音识别方法和装置。所述语音识别方法包括激活用于接收音频信号的输入的会话,在维持所述会话的同时,对从所述输入音频信号检测到的语音信号执行语音识别,基于从所述语音信号生成的说话者信息,确定语音信号的说话者是否是注册的说话者,基于所述确定的结果确定是否维持会话,并输出执行所述语音识别的结果。
技术领域
本公开涉及语音识别方法和设备。更具体地,本公开涉及一种用于基于说话者(speaker)识别来识别语音的方法和装置,并且当在语音识别系统中识别出语音时输出语音识别的结果。
背景技术
近来,由于已经开发了执行各种功能的诸如智能电话的电子设备,因此已经发布了具有嵌入其中的语音识别功能以改善可操纵性的电子设备。语音识别功能有利于识别用户的语音而无需经由触摸模块对于按钮或接触的单独操纵,从而允许用户容易地控制设备。
由于语音识别功能,用户可以在不需要诸如智能手机的便携式终端的单独输入按钮的情况下运行呼叫功能或写入文本消息,并且可以容易地设置各种功能,例如导航、因特网搜索、警报设置等。
以上信息仅作为背景信息呈现,并有助于理解本公开。没有做出任何确定,并且没有断言关于上述任何一个是否适用于关于本公开的现有技术。
发明内容
提供本公开的各方面以解决至少上述问题和/或缺点,并提供至少下述优点。
在根据一个或多个实施例的语音识别系统中,仅经由说话者验证输出关于注册的说话者的话语(utterance)的语音识别结果,使得在诸如智能电话的个性化设备中可以进行语音识别的个性化。另外,在根据一个或多个实施例的语音识别系统中,减少了用户不必要地激活会话的次数,从而可以增加用户使用语音识别系统的便利性。另外,在根据一个或多个实施例的语音识别系统中,对于认为个人信息保护很重要的用户来说,个性化语音识别是可能的。
附图说明
图1是根据本公开实施例的常规语音识别方法的流程图;
图2A、图2B、图2C和图2D示出了根据本公开各种实施例的语音识别系统;
图3A和图3B是根据本公开各种实施例的语音识别装置的框图;
图4是根据本公开实施例的语音识别方法的流程图;
图5是根据本公开另一实施例的语音识别方法的流程图;
图6是根据本公开的实施例的处理器的框图;
图7是根据本公开另一实施例的语音识别方法的流程图;
图8是用于描述根据本公开的实施例的由语音识别装置执行的执行语音识别和生成说话者信息的方法的图;
图9是用于描述根据本公开的实施例的由语音识别装置执行的用于实时说话者识别的通过使用相邻帧的信息来执行归一化的方法的图;
图10是用于描述根据本公开的实施例的由语音识别装置执行的基于说话者识别的结果来管理会话的维护(maintenance)和更新已注册说话者信息的方法的图;
图11A、图11B和图11C示出了其中根据本公开各种实施例的语音识别装置输出语音识别结果的示例;
图12A和图12B示出了其中根据本公开各种实施例的语音识别装置输出语音识别结果的另一示例;
图13A、图13B和图13C示出了其中根据本公开各种实施例的语音识别装置输出语音识别结果的另一示例;
图14A、图14B和图14C示出了其中根据本公开各种实施例的语音识别装置输出语音识别结果的另一示例;
图15是根据本公开的实施例的语音识别系统中的操作的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780052734.6/2.html,转载请声明来源钻瓜专利网。