[发明专利]一种基于主题损失的视觉问答模型构建方法在审
申请号: | 202110430766.3 | 申请日: | 2021-04-21 |
公开(公告)号: | CN113157889A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 金鑫;周兴晖;吕建文;肖超恩 | 申请(专利权)人: | 韶鼎人工智能科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/583;G06F16/55;G06N3/04;G06N3/08 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 张乾桢 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明提出一种基于主题损失的视觉问答模型构建方法,所述视觉问答模型包括三个部分:视觉特征提取部分、问题提取部分和信息融合部分,在视觉问答模型中设计有一种损失函数,用于约束视觉问答中回答的生成与图像内容相关;使用卷积神经网络(CNN)和长短时记忆网络(LSTM)进行视觉问答任务,同时使用适用于多主题的损失函数。本发明对图像和问题分别编码后输出的向量进行融合,并执行视觉问答任务。同时由于许多主题的关键词数量较多,添加适用针对不同主题的损失函数将取得更好的效果。通过视觉问答,人们可以从图像中获得更多想要的信息,该技术可应用于智能拍照指导、艺术品评价指导、机器人智能交互等等应用领域,对计算机视觉和模式识别的影响深远。 | ||
搜索关键词: | 一种 基于 主题 损失 视觉 问答 模型 构建 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韶鼎人工智能科技有限公司,未经韶鼎人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110430766.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种地线零磁场线材
- 下一篇:一种门五金件自动安装机及门锁加工方法