[发明专利]机器人基于声源定位判断交互对象的方法和系统有效
申请号: | 202211503728.7 | 申请日: | 2022-11-28 |
公开(公告)号: | CN115862668B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 朱世强;方伟;郑涛;谢安桓;宋伟;顾建军 | 申请(专利权)人: | 之江实验室 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/27;G10L25/48;H04W4/029;G06F17/10;G01S5/20 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;杨东炜 |
地址: | 311121 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器人 基于 声源 定位 判断 交互 对象 方法 系统 | ||
机器人基于声源定位判断交互对象的方法,包括:S1.预处理信息;S2.计算机器人周边人物相对于x轴单位向量的夹角;S3.判断交互对象。在语音从开始输入至输出结束的时间内,根据声源定位的角度,再结合视觉输出的机器人周边人物的坐标,计算出机器人周边哪个人物的方位与声源定位角度最接近,最接近的人物即为与机器人交互的人物。
技术领域
本发明涉及人工智能机器人行为交互,本发明是机器人基于声源定位和视觉等信息判断机器人周边人物谁与机器人交互的方法和系统,适用于一切服务型机器人。
技术背景
服务型机器人主要用于和用户进行沟通交流,一般情况下,用户语音输入指令后,然后机器人根据用户语音输入的指令实施特定的行为或与用户进行交流。在日常生活中,当人们与其他人交流时,为礼貌,人们都会“看向”说话交流人,并且面对不同说话交流人,有不同的情绪和行为。但机器人在周边一大群人中该如何寻找何人正在与机器人交互,现有技术没有很好的解决办法。
发明内容
本发明要克服现有技术的上述缺点,提供机器人基于声源定位判断交互对象的方法和系统。
本发明设计了一种基于声源定位和视觉,从而判断机器人周边的人物中何人是交互对象的方法,适用于服务型机器人。本发明解决现有问题的技术方案是:在语音从开始输入至输出结束的时间内,根据声源定位的角度,再结合视觉输出的机器人周边人物的坐标,计算出机器人周边哪个人物的方位与声源定位角度最接近,最接近的人物即为交互对象。
机器人基于声源定位判断交互对象的方法,包括如下步骤:
S1.预处理信息;
S2.计算机器人周边人物相对于x轴单位向量的夹角;
S3.判断交互对象。
优选地,步骤S1具体包括:
S11.构建坐标系,以机器人所在位置的地面为原点,机器人水平方向为x轴,机器人右向为x轴正方向,机器人水平方向为y轴,机器人正后方为y轴正方向。机器人垂直方向为z轴,上方为z轴正方向;
S12.构建一个表示人物信息的集合S={id,x,y,θ}。
进一步,步骤S12具体包括:
视觉模块下发机器人周边人物位置信息x,y,分别表示人物的水平位置坐标;
视觉模块下发机器人周边人物id,id是机器人周边人物的唯一标识,对于同一个人物,id是固定的,且id为正数,且从1开始逐一增加;
声源定位模块下发声源定位水平角度θ(0=θ2π,如人在机器人正右方,θ=0;如人在机器人右后方,如人在机器人正后方,/如人在机器人左后方,如人在机器人正左方,θ=π;如人在机器人左前方,/如人在机器人正前方,/如人在机器人右前方,/如检测到此时无人说话,θ=-1;/
机器人采集以上信息的时间频率为f,即1秒时间内生成的信息总量,语音从输入开始至输入结束持续时间为t秒,在该t秒内生成的信息总量为一个集合E={S1,S2,S3,…,Stf},在集合E中共有tf个集合S;
VAD后端超时时间为T。
优选地,步骤S2具体包括:
S21.构建初始以原点(机器人所在位置)为起点,机器人周边人物所在位置为终点的向量
S22.计算机器人周边人物的向量与x轴单位向量之间的夹角;
S23.计算第i(1=i=tf)个时刻第j个人物相对于x轴之间的夹角βi,j。
进一步,步骤S22具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211503728.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可溶性微针的制备方法及所得可溶性微针
- 下一篇:一种采石场勘探方法和系统