[发明专利]一种用户意图识别方法、装置、设备和存储介质有效
申请号: | 202011282000.7 | 申请日: | 2020-11-16 |
公开(公告)号: | CN112395973B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 黄剑;杨博;熊蔡华;李小龙;茹宏格;晏箐阳 | 申请(专利权)人: | 华中科技大学鄂州工业技术研究院;华中科技大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/764;G06V10/774;G06V10/82;G16H20/30;G16H50/20;G06N3/04;G06N3/08 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 梁凯 |
地址: | 436044 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 意图 识别 方法 装置 设备 存储 介质 | ||
1.一种用户意图识别方法,其特征在于,所述方法包括:
获取用户的多个注视点位置信息;
获取物体的二维质心坐标信息;
获取用户的抓握位置信息;
通过滑动窗口技术、所述用户的多个注视点位置信息以及所述物体的二维质心坐标信息计算第一距离;
通过滑动窗口技术、所述用户的多个注视点位置信息以及所述用户的抓握位置信息计算至少两个第二距离向量;
通过滑动窗口技术计算所述用户的多个注视点位置信息的方差,得到第一方差;
将所述第一距离、所述第二距离向量以及所述第一方差输入至训练好的分类器,得到分类结果;
根据所述分类结果得到用户意图;
所述获取用户的多个注视点位置信息,包括:
通过眼动仪获取用户的多张输入图像;
通过F(ti)=(fx(ti),fy(ti))获取用户的多个注视点位置信息,其中ti表示对应第i帧注视图像的时刻,fχ(ti)表示在第i帧所述注视图像的二维注视横坐标,fy(ti)表示在第i帧注视图像的二维注视纵坐标,F(ti)表示所述注视点位置信息;
所述通过滑动窗口技术、所述用户的多个注视点位置信息以及所述物体的二维质心坐标信息计算第一距离,包括:
通过计算所述第一距离,其中所述n为所述输入图像的数量,ADF2C为所述第一距离;
所述通过滑动窗口技术、所述用户的多个注视点位置信息以及所述用户的抓握位置信息计算至少两个第二距离向量,包括:
通过计算食指距离,其中ADF2I为所述食指距离;
通过计算拇指距离,其中ADF2T为所述拇指距离;
将所述食指距离以及拇指距离组合成第二距离向量;
所述通过滑动窗口技术计算所述用户的多个注视点位置信息的方差,得到第一方差,包括
通过计算几何中心,其中O为几何中心;
通过计算多个注视中心与所述几何中心的欧拉距离,其中di表示第i个注视点到注视中心O的欧拉距离;
通过计算所述欧拉距离的平均值,其中所述M为距离的均值;
通过计算所述第一方差,其中VAR为所述第一方差。
2.根据权利要求1所述的方法,其特征在于,所述获取物体的二维质心坐标信息,包括:
将所述多张输入图像输入至训练好的神经网络模型,得到多个像素坐标;
通过计算所述物体的二维质心坐标信息,其中pij为第i帧所述注视图像的第j个目标的像素值,xij为第i帧所述注视图像的第j个目标的所述像素坐标的横坐标,yij为第i帧所述注视图像的第j个目标的像素坐标的纵坐标,x,y为所述物体的二维质心坐标信息。
3.根据权利要求2所述的方法,其特征在于,所述获取用户的抓握位置信息,包括:
获取数据库存储的抓握数据;
通过统计分布获取食指抓握点坐标g1xj(ti),g1yj(ti);
通过统计分布获取拇指抓握点坐标g2xj(ti),g2yj(ti)。
4.一种计算机设备,其特征在于,所述计算机设备包括:
至少一个处理器、存储器和输入输出单元;
其中,所述存储器用于存储程序代码,所述处理器用于调用所述存储器中存储的程序代码来执行如权利要求1-3中任一项所述的方法。
5.一种计算机存储介质,其特征在于,其包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-3中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学鄂州工业技术研究院;华中科技大学,未经华中科技大学鄂州工业技术研究院;华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011282000.7/1.html,转载请声明来源钻瓜专利网。