[发明专利]在包括多个设备的环境中的语音识别方法和设备在审
申请号: | 201980055917.2 | 申请日: | 2019-10-22 |
公开(公告)号: | CN112639965A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 曹根硕;卢在英;邢知远;张东韩;李在原 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/12;G10L17/08;G10L15/22 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 曾世骁;田方 |
地址: | 韩国京畿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 包括 设备 环境 中的 语音 识别 方法 | ||
1.一种由语音识别设备执行的用于在存在多个语音识别设备的空间中执行语音识别的语音识别方法,
所述语音识别方法包括:
从输入音频信号中提取说话者的语音信号;
获得指示所述语音信号与注册说话者的语音信号之间的相似度的第一说话者识别分数;以及
基于从所述多个语音识别设备中的另一语音识别设备获得的第二说话者识别分数并且基于第一说话者识别分数,输出针对所述语音信号的语音识别结果。
2.如权利要求1所述的语音识别方法,还包括:
获得第二说话者识别分数,
其中,第二说话者识别分数指示由另一语音识别设备接收的语音信号与注册说话者的语音信号之间关于说话者的话语的相似度。
3.如权利要求1所述的语音识别方法,还包括:
基于将第一说话者识别分数与第二说话者识别分数进行比较的结果,从所述语音识别设备和所述另一语音识别设备中确定更靠近说话者的设备,其中,输出语音识别结果的步骤包括:
基于更靠近说话者的设备被确定为所述语音识别设备,输出针对所述语音信号的语音识别结果。
4.如权利要求1所述的语音识别方法,其中,输出语音识别结果的步骤包括:
基于第一说话者识别分数大于第二说话者识别分数,输出针对所述语音信号的语音识别结果。
5.如权利要求3所述的语音识别方法,其中,确定设备更靠近说话者的步骤包括:
基于所述语音识别设备的位置、所述另一语音识别设备的位置以及针对说话者识别分数基于说话者与所述语音识别设备之间的距离的改变的先前存储的信息来确定更靠近说话者的设备。
6.如权利要求1所述的语音识别方法,还包括:
将脉冲信号输出到所述语音识别设备的外部;
通过对响应于脉冲信号而接收的音频信号进行分析来获得关于所述语音识别设备的外部环境的信息;以及
基于关于外部环境的信息更新先前存储的与注册说话者的语音信号有关的信息。
7.如权利要求3所述的语音识别方法,其中,确定更靠近说话者的设备的步骤包括:
基于针对说话者识别分数基于说话者和所述语音识别设备之间的距离的改变的先前存储的说话者/距离信息、第一说话者识别分数和第二说话者识别分数来确定更靠近说话者的设备,
所述方法还包括:基于根据第一说话者识别分数等于或大于阈值而确定更靠近说话者的设备的结果来更新说话者/距离信息。
8.如权利要求3所述的语音识别方法,其中,确定更靠近说话者的设备的步骤包括:
基于针对说话者识别分数基于说话者和所述语音识别设备之间的距离的改变的先前存储的说话者/距离信息、第一说话者识别分数和第二说话者识别分数来预测说话者和所述语音识别设备之间的距离;以及
基于预测的距离,在所述语音识别设备和所述另一语音识别设备中确定更靠近说话者的设备,
所述方法还包括:基于第一说话者识别分数和预测的距离来更新说话者/距离信息。
9.如权利要求1所述的语音识别方法,其中,获得第一说话者识别分数的步骤包括:
获得指示所述语音信号与多个注册说话者的语音信号之间的相似度的多个候选说话者识别分数;
选择与具有所述多个候选说话者识别分数中的最高值的第一候选说话者识别分数相应的第一注册说话者;以及
基于第一候选说话者识别分数等于或大于阈值,获得第一候选说话者识别分数作为第一说话者识别分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980055917.2/1.html,转载请声明来源钻瓜专利网。