[发明专利]视觉问答处理方法、设备、计算机可读介质和程序产品在审
申请号: | 202110994133.5 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113722458A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 连欢;朱飞 | 申请(专利权)人: | 海信电子科技(武汉)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/279;G06F40/35;G06N3/04;G06N3/08;G10L15/16;G10L15/18;H04N21/422;H04N21/475 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
地址: | 430073 湖北省武汉市东湖新技术开发*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供一种视觉问答处理方法、设备、计算机可读介质和程序产品。该方法包括:接收用户通过交互接口输入的提问指令,并获取提问指令及对应的显示画面;对提问指令的意图类型进行识别;若识别出意图类型为非通用类型,则将提问指令输入至对应的典型属性模型得到提问指令的答案信息;若识别出意图类型为通用类型,则将提问指令输入至通用视觉问答VQA模型以对提问指令与显示画面进行深度协同注意力学习,得到提问指令的答案信息;将指令的答案信息输出给用户。本申请的方法,针对提问的意图类型可输入至对应的典型属性模型或VQA模型,为从显示画面中确定提问指令的答案提供了更多维度的匹配方法,提升了视觉问答结果的准确率。 | ||
搜索关键词: | 视觉 问答 处理 方法 设备 计算机 可读 介质 程序 产品 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信电子科技(武汉)有限公司,未经海信电子科技(武汉)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110994133.5/,转载请声明来源钻瓜专利网。