[发明专利]基于图像生成文本信息的方法、装置、存储介质及处理器在审
申请号: | 202310524365.3 | 申请日: | 2023-05-10 |
公开(公告)号: | CN116543402A | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 殷永秋;高斯雄 | 申请(专利权)人: | 重庆长安汽车股份有限公司 |
主分类号: | G06V30/41 | 分类号: | G06V30/41;G06V30/18;G06V30/19;G06V10/82;G06N3/0464;G06N3/0442;G06F40/216;G06F40/284 |
代理公司: | 北京润平知识产权代理有限公司 11283 | 代理人: | 黄韬 |
地址: | 400023 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例提供一种基于图像生成文本信息的方法、装置、存储介质及处理器,属于计算机视觉中的图文互译领域。所述方法包括:获取待处理图片和样本图像数据集,并确定样本图像数据集中的相似图像;对待处理图片进行特征提取,获得待处理图片的区域特征;对所述待处理图片的区域特征进行过滤择优,获得待处理图片的主体区域特征;对所述样本图像数据集中的相似图像进行特征提取,获得多个相似图像特征;基于所述多个相似图像特征,采用加权均值的方式获得第一融合特征;将所述第一融合特征采用拼接的方法融合到待处理图片的主体区域特征,获得第二融合特征;将所述第二融合特征输入细粒度多层长短期记忆网络,生成待处理图像所对应的文本信息。 | ||
搜索关键词: | 基于 图像 生成 文本 信息 方法 装置 存储 介质 处理器 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆长安汽车股份有限公司,未经重庆长安汽车股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310524365.3/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序