[发明专利]机器人基于声源定位判断交互对象的方法和系统有效
申请号: | 202211503728.7 | 申请日: | 2022-11-28 |
公开(公告)号: | CN115862668B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 朱世强;方伟;郑涛;谢安桓;宋伟;顾建军 | 申请(专利权)人: | 之江实验室 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/27;G10L25/48;H04W4/029;G06F17/10;G01S5/20 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;杨东炜 |
地址: | 311121 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器人 基于 声源 定位 判断 交互 对象 方法 系统 | ||
1.机器人基于声源定位判断交互对象的方法,包括如下步骤:
S1.预处理信息;
S2.计算机器人周边人物相对于x轴单位向量的夹角;
S3.判断交互对象。
2.如权利要求1所述的机器人基于声源定位判断交互对象的方法,其特征在于:步骤S1具体包括:
S11.构建坐标系,以机器人所在位置的地面为原点,机器人水平方向为x轴,机器人右向为x轴正方向,机器人水平方向为y轴,机器人正后方为y轴正方向。机器人垂直方向为z轴,上方为z轴正方向;
S12.构建一个表示人物信息的集合S={id,x,y,θ}。
3.如权利要求2所述的机器人基于声源定位判断交互对象的一种方法,其特征在于:步骤S12具体包括:
视觉模块下发机器人周边人物位置信息x,y,分别表示人物的水平位置坐标;
视觉模块下发机器人周边人物id,id是机器人周边人物的唯一标识,对于同一个人物,id是固定的,且id为正数,且从1开始逐一增加;
声源定位模块下发声源定位水平角度θ(0=θ2π,如人在机器人正右方,θ=0;如人在机器人右后方,如人在机器人正后方,/如人在机器人左后方,/如人在机器人正左方,θ=π;如人在机器人左前方,/如人在机器人正前方,/如人在机器人右前方,/如检测到此时无人说话,θ=-1;
机器人采集以上信息的时间频率为f,即1秒时间内生成的信息总量,语音从输入开始至输入结束持续时间为t秒,在该t秒内生成的信息总量为一个集合E={S1,S2,S3,…,Stf},在集合E中共有tf个集合S;
VAD后端超时时间为T。
4.如权利要求1所述的机器人基于声源定位判断交互对象的方法,其特征在于:步骤S2具体包括:
S21.构建初始以原点(机器人所在位置)为起点,机器人周边人物所在位置为终点的向量
S22.计算机器人周边人物的向量与x轴单位向量之间的夹角;
S23.计算第i(1=i=tf)个时刻第j个人物相对于x轴之间的夹角βi,j。
5.如权利要求4所述的机器人基于声源定位判断交互对象的方法,其特征在于:步骤S22具体包括:
设第i个时刻机器人周边人物j的向量与x轴单位向量之间的夹角为/
则/
6.如权利要求4所述的机器人基于声源定位判断交互对象的方法,其特征在于:步骤S23所述的夹角βi,j包括以下情形:
当人在机器人正右方,βi,j=0;
当人在机器人右后方,
当人在机器人正后方,
当人机器人左后方,
当人在机器人正左方,βi,j=π;
当人在机器人左前方,
当人在机器人正前方,
当人在机器人右前方,
7.如权利要求1所述的机器人基于声源定位判断交互对象的方法,其特征在于:步骤S3具体包括:
S31.计算第i(1=i=(t-T)f)个时刻机器人周边哪个人物的βi,j与此时声源定位角度θi,j之间的绝对值最小;即min(|βi,j-θi,j|)对应的人物id;
S32.构建一个集合N={min(|βi,j-θi,j|)对应的人物id,(1=i=(t-T)f)};
S33.统计集合N中人物id出现的次数,集合N中人物id出现的次数最多的人物id为交互对象。
8.机器人基于声源定位判断交互对象的系统,其特征在于:包括:
信息预处理模块,用于预处理信息;
向量夹角计算模块,用于计算机器人周边人物相对于x轴单位向量的夹角;
交互对象判断模块,用于判断交互对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211503728.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可溶性微针的制备方法及所得可溶性微针
- 下一篇:一种采石场勘探方法和系统