[发明专利]一种人体意图识别方法、系统以及存储介质有效
申请号: | 202010699862.3 | 申请日: | 2020-07-20 |
公开(公告)号: | CN111967334B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 闫野;吴竞寒;印二威;谢良;邓宝松;范晓丽;罗治国;闫慧炯;杨超 | 申请(专利权)人: | 中国人民解放军军事科学院国防科技创新研究院;天津(滨海)人工智能军民融合创新中心 |
主分类号: | G06F18/10 | 分类号: | G06F18/10;G06F18/24;G06F18/25;G06F40/30;G06N3/0464;G06N3/08 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 100071*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人体 意图 识别 方法 系统 以及 存储 介质 | ||
1.一种人体意图识别方法,其特征在于,所述方法包括:
实时采集当前人体的特征信号;
基于所述特征信号生成所述当前人体对应的多源数据特征以及眼睛选定的注视点坐标;
识别所述多源数据特征以及眼睛选定的注视点坐标,生成所述多源数据特征对应的语音文本以及所述注视点坐标对应的场景图像描述文本;其中,
所述识别所述多源数据特征以及眼睛选定的注视点坐标,生成所述多源数据特征对应的语音文本以及所述注视点坐标对应的场景图像描述文本,包括:
将所述多源数据特征进行稠密编码,生成编码后的多源数据特征;
将所述编码后的多源数据特征输入至预先训练的Bert网络模型中,生成所述多源数据特征对应的语音信息;
利用集束搜索算法的n-gram语言模型将所述多源数据特征对应的语音信息进行文本合成,生成所述多源数据特征对应的语音文本;
对所述眼睛选定的注视点坐标进行编码,生成所述注视点坐标对应的场景图像描述文本;其中,
所述对所述眼睛选定的注视点坐标进行编码,生成所述注视点坐标对应的场景图像描述文本,包括:
根据所述眼睛选定的注视点坐标生成眼睛选定的场景图像;
利用ResNet101的Fast R-CNN算法对所述场景图像依次进行图像分割、目标检测以及坐标信息识别,生成编码信息;
基于所述编码信息进行编码建模,生成所述注视点坐标对应的场景图像描述文本;
针对所述语音文本以及场景图像描述文本进行实体抽取,生成所述语音文本以及场景图像描述文本对应的实体片段;
采用共指消解算法处理所述实体片段,生成目标对象;
基于所述语音文本、场景图像描述文本以及目标对象,生成人体意图识别结果;其中,
所述基于所述语音文本、场景图像描述文本以及目标对象,生成人体意图识别结果,包括:
针对所述语音文本、场景图像描述文本以及目标对象进行文本语义分析,生成文本的编码;
将所述文本的编码和预先定义的元组进行关联,生成可执行的实例化元组;
根据所述实例化元组生成语义分析结果和表征结果;
将所述语义分析结果和表征结果确定为人体意图识别结果。
2.根据权利要求1所述的方法,其特征在于,所述生成人体意图识别结果之后,还包括:
将所述人体意图识别结果进行显示并发送至外接设备,控制所述外接设备执行功能。
3.根据权利要求1或2所述的方法,其特征在于,所述特征信号包括音频信号、唇部图像信号、面部肌电信号和眼睛图像信号;
所述基于所述特征信号生成所述当前人体对应的多源数据特征以及眼睛选定的注视点坐标,包括:
分别将所述音频信号、唇部图像信号、面部肌电信号进行数据预处理,生成所述当前人体对应的多源数据特征;
对所述眼睛图像信号进行注视点坐标提取,生成所述当前人体对应的眼睛选定的注视点坐标。
4.根据权利要求3所述的方法,其特征在于,所述分别将所述音频信号、唇部图像信号、面部肌电信号进行数据预处理,生成所述当前人体对应的多源数据特征,包括:
对所述音频信号进行分帧和加窗处理,生成音频信号数据特征;
提取所述面部肌电信号的梅尔倒谱系数,生成面部肌电信号数据特征;
将所述唇部 图像信号进行灰度图转化,并使用滤波器进行滤波,生成唇部 图像信号数据特征;
将所述音频信号数据特征、面部肌电信号数据特征以及唇部 图像信号数据特征确定为所述当前人体对应的多源数据特征。
5.根据权利要求3所述的方法,其特征在于,所述对所述眼睛图像信号进行注视点坐标提取,生成所述当前人体对应的眼睛选定的注视点坐标,包括:
将所述眼睛图像信号输入预先训练的注视点映射模型中,生成所述当前人体对应的眼睛选定的注视点坐标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院国防科技创新研究院;天津(滨海)人工智能军民融合创新中心,未经中国人民解放军军事科学院国防科技创新研究院;天津(滨海)人工智能军民融合创新中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010699862.3/1.html,转载请声明来源钻瓜专利网。