[发明专利]一种机器人及其控制方法、计算机可读存储介质在审
申请号: | 201911384200.0 | 申请日: | 2019-12-28 |
公开(公告)号: | CN111241922A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 黄冠文;程骏;庞建新;谭欢;熊友军 | 申请(专利权)人: | 深圳市优必选科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 李莉 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机器人 及其 控制 方法 计算机 可读 存储 介质 | ||
1.一种机器人的控制方法,其特征在于,所述方法包括:
从采集的待检测图像中的获取至少一个人脸信息;
从所述至少一个人脸信息中获取对应的至少一个嘴唇信息;
将所述至少一个嘴唇信息输入至预设深度学习模型,以对所述至少一个嘴唇信息进行分类,以进一步确定正在说话的说话人脸区域;
控制所述机器人转动至朝向所述说话人脸区域,并开启语音识别功能。
2.根据权利要求1所述的方法,其特征在于,
所述人脸信息包括人脸框坐标、人脸特征点坐标、嘴唇框坐标、嘴唇特征点坐标、人脸ID中的至少一个,所述人脸ID用于表示对应人脸信息的身份。
3.根据权利要求1所述的方法,其特征在于,
所述从所述至少一个人脸信息中获取对应的至少一个嘴唇信息,包括:
根据所述至少一个人脸信息中的目标人脸信息确定对应的目标人脸区域;
获取所述目标人脸区域的特征点信息;
判断所述目标人脸信息和/或所述特征点信息是否满足设定约束条件;
若满足,则确定所述目标人脸区域中的嘴唇信息。
4.根据权利要求3所述的方法,其特征在于,
所述判断所述目标人脸信息和/或所述特征点信息是否满足设定约束条件,包括:
根据所述目标人脸信息判断所述目标人脸区域的像素值是否大于设定像素阈值;和/或
根据所述目标人脸信息判断所述目标人脸区域与所述待检测图像的边缘之间的距离是否大于设定距离阈值;和/或
根据所述特征点信息判断所述目标人脸区域的朝向是否在设定角度阈值之内。
5.根据权利要求3所述的方法,其特征在于,
所述确定所述目标人脸区域中的嘴唇信息,包括:
根据所述目标人脸信息确定人脸ID;其中,所述人脸ID用于表示对应人脸信息的身份;
根据所述目标人脸区域中的特征点信息确定嘴唇特征向量;
将所述嘴唇特征向量对应所述人脸ID进行存储。
6.根据权利要求5所述的方法,其特征在于,
所述将所述至少一个嘴唇信息输入至预设深度学习模型,以对所述至少一个嘴唇信息进行分类,以进一步确定正在说话的说话人脸区域,包括:
在对应所述人脸ID存储的所述嘴唇特征向量的数量满足设定数量要求时,将对应所述人脸ID存储的多个嘴唇特征向量输入至预设深度学习模型,以对所述多个嘴唇特征向量进行分类,以进一步确定所述目标人脸区域是否为正在说话的说话人脸区域。
7.根据权利要求5所述的方法,其特征在于,
所述根据所述目标人脸区域中的特征点信息确定嘴唇特征向量,包括:
根据所述目标人脸区域中的特征点信息,确定嘴唇框坐标;
根据所述嘴唇框坐标获取嘴唇图像;
对所述嘴唇图像进行编码,以得到嘴唇特征向量。
8.根据权利要求1所述的方法,其特征在于,
所述控制所述机器人转动至朝向所述说话人脸区域,并开启语音识别功能,包括:
获取所述说话人脸区域的人脸框坐标;
获取所述机器人的当前朝向与所述人脸框坐标之间的偏转角;
根据所述偏转角控制所述机器人转动至朝向所述说话人脸区域;
开启语音识别功能。
9.一种机器人,其特征在于,所述机器人包括相互连接的处理器和存储器,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现如权利要求1-8任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序数据,所述程序数据在被处理器执行时,用以实现如权利要求1-8任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市优必选科技股份有限公司,未经深圳市优必选科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911384200.0/1.html,转载请声明来源钻瓜专利网。