[发明专利]针对复杂关系描述的图片视觉推理方法、设备及存储介质有效
申请号: | 202010290767.8 | 申请日: | 2020-04-14 |
公开(公告)号: | CN111475668B | 公开(公告)日: | 2023-03-17 |
发明(设计)人: | 谭明奎;郑逸涵 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/58;G06V10/25;G06V10/74;G06V10/764;G06V10/82;G06N3/0442;G06N3/045;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 巴翠昆 |
地址: | 510641 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种针对复杂关系描述的图片视觉推理方法、设备及存储介质,包括:获取待处理的描述语句和图片;将图片输入深度神经网络,获取图片中的物体特征;利用注意力机制将描述语句划分为不同类型信息的语句,获取不同类型信息的语句对应的语句特征;结合获取的物体特征和语句特征,将语句与图片中物体对应,以及利用图神经网络模型构建图片中物体间关系,将语句与图片中物体间关系对应,更新物体特征;根据获取的语句特征和更新后的物体特征,预测图片中的描述对象。通过上述方法对描述语句包含的信息进行合理划分,并通过图神经网络模型建模物体间的复杂关系,实现了视觉关系推理,进而有效地提高了复杂关系描述下的视觉推理效果。 | ||
搜索关键词: | 针对 复杂 关系 描述 图片 视觉 推理 方法 设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010290767.8/,转载请声明来源钻瓜专利网。