[发明专利]声源定位方法、装置、语音识别控制方法和终端设备有效
| 申请号: | 202010072723.8 | 申请日: | 2020-01-21 |
| 公开(公告)号: | CN111276143B | 公开(公告)日: | 2023-04-25 |
| 发明(设计)人: | 李千伟;徐林浩;何天翼 | 申请(专利权)人: | 北京远特科技股份有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 梁韬 |
| 地址: | 100080 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声源 定位 方法 装置 语音 识别 控制 终端设备 | ||
本发明提供一种声源定位方法、装置、语音识别控制方法和终端设备,该声源定位方法包括:当检测到语音唤醒实例被唤醒时,确定语音唤醒实例的数量;当存在至少两路语音唤醒实例被唤醒时,确定每一路语音唤醒实例各自对应的语音唤醒实例结果,语音唤醒实例结果包括唤醒得分和唤醒能量;根据各路语音唤醒实例所对应的唤醒得分和唤醒能量计算得到声源方位定位。上述声源定位方法能够对于多路声源信息进行区分,从而对目标声源信息进行定位,从而为选取合适的目标声源信息进行语音识别奠定了基础。
技术领域
本发明涉及语音识别领域,尤其涉及一种声源定位方法、装置、语音识别控制方法和终端设备。
背景技术
随着互网的高速发展,人们的生活越来越智能化,智能手机和语音控制等等酷炫功能让人们的生活越来越方便。汽车作为人们日常出行的重要工具也不例外,而车载控制终端更是体现了汽车的智能化,其中由以语音控制智能化最高,用语言代替手来控制车身。
其中,传统的语音控制中,往往对于多人会话场景不能完美适应,例如车内主驾驶在唤醒语音时,如果副驾发出指令,此时极易造成车辆控制的混乱。
发明内容
鉴于此,本发明提供一种声源定位方法、装置、语音识别控制方法和终端设备,能够对于多路声源信息进行区分,从而对目标声源信息进行定位,从而为选取合适的目标声源信息进行语音识别奠定了基础。
上述声源定位方法包括:
当检测到语音唤醒实例被唤醒时,确定语音唤醒实例的数量;
当存在至少两路语音唤醒实例被唤醒时,确定每一路语音唤醒实例各自对应的语音唤醒实例结果,语音唤醒实例结果包括唤醒得分和唤醒能量;
根据各路语音唤醒实例所对应的唤醒得分和唤醒能量计算得到声源方位定位。
在一个实施例中,声源定位方法还包括:
当仅存在一路语音唤醒实例被唤醒时,计算当前唤醒时间与上一次唤醒时间的唤醒时间间隔;
判断唤醒时间间隔是否大于预设时间阈值;
若是,则将语音唤醒实例对应方向作为声源方位定位。
在一个实施例中声源定位方法还包括:
当唤醒时间间隔小于或等于预设时间阈值时,返回所述“当检测到语音唤醒实例被唤醒时,确定语音唤醒实例的数量”的步骤。
在一个实施例中根据各路语音唤醒实例所对应的唤醒得分和唤醒能量计算得到声源方位定位的步骤包括:
确定各路语音唤醒实例所对应的唤醒得分中的唤醒得分最大值以及与唤醒得分最大值所对应的唤醒能量;
确定各路语音唤醒实例所对应的唤醒能量中的唤醒能量最大值以及与唤醒能量最大值所对应的唤醒得分;
根据唤醒得分最大值和唤醒能量最大值所对应的唤醒得分计算唤醒得分比例差值;
根据唤醒能量最大值和唤醒得分最大值所对应的唤醒能量计算唤醒能量比例差值;
根据唤醒得分比例差值和唤醒能量比例差值确定声源方位定位。
在一个实施例中根据唤醒得分比例差值和唤醒能量比例差值确定声源方位定位的步骤包括:
判断唤醒得分比例差值是否大于第一预设比例阈值且唤醒能量比例差值是否小于第二预设比例阈值,第一预设比例阈值大于第二预设比例阈值;
若是,则将唤醒得分最大值所对应的语音唤醒实例的波束方向作为声源方位定位;
若否,则将唤醒能量最大值所对应的语音唤醒实例的波束方向作为声源方位定位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京远特科技股份有限公司,未经北京远特科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010072723.8/2.html,转载请声明来源钻瓜专利网。





