[发明专利]一种增加图像文本描述多样性方法在审
| 申请号: | 202110816869.3 | 申请日: | 2021-07-20 |
| 公开(公告)号: | CN113657170A | 公开(公告)日: | 2021-11-16 |
| 发明(设计)人: | 朱虹;杜森;史静;张雨嘉;刘媛媛;王栋 | 申请(专利权)人: | 西安理工大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06F40/205;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 西安弘理专利事务所 61214 | 代理人: | 戴媛 |
| 地址: | 710048 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 增加 图像 文本 描述 多样性 方法 | ||
本发明公开了一种增加图像文本描述多样性方法,步骤包括:步骤1、表达待描述图像的目标重要性;步骤2、构建原始彩色图像Image中目标的相邻关系结构图,表达关联关系重要性;步骤3、对检测到的目标进行筛选,得到文本描述网络需要的特征;步骤4、将随机删除非重要目标后的β组目标检测框特征,输入图像文本描述网络,生成多条描述语句。本发明的方法,在进入图像的文本描述网络前对图像中的目标进行重要性表达,将图像中出现的目标分为重要目标和非重要目标,通过随机删除非重要且不影响图像语义的目标,使得图像文本描述网络能够生成不同的描述语句,丰富描述语句的多样性。
技术领域
本发明属于图像文本描述技术领域,涉及一种增加图像文本描述多样性方法。
背景技术
图像文本描述算法是指根据输入图像的内容,自动生成描述性文字的方法。在实际中具有重要意义和广泛应用。如对图像进行快速分析、处理;将图像转化为文本,辅助视觉障碍人士理解图像内容。此外,图像文本描述在图像智能审核、检索、分类等方面也有着十分重要的应用。然而通过图像文本描述算法对图像进行描述时,绝大多数方法仅能通过一条或者是少量几条相近含义的描述语句描述图像内容,难以满足语义多样性的要求。
发明内容
本发明的目的是提供一种增加图像文本描述多样性方法,解决了现有技术在图像文本描述过程中,生成描述语句过于单一的问题。
本发明所采用的技术方案是,一种增加图像文本描述多样性方法,按照以下步骤实施:
步骤1、表达待描述图像的目标重要性;
步骤2、构建原始彩色图像Image中目标的相邻关系结构图,表达关联关系重要性;
步骤3、对检测到的目标进行筛选,得到文本描述网络需要的特征;
步骤4、将随机删除非重要目标后的β组目标检测框特征,输入图像文本描述网络,生成多条描述语句。
本发明的有益效果是,在进入图像的文本描述网络前对图像中的目标进行重要性表达,将图像中出现的目标分为重要目标和非重要目标,通过随机删除非重要且不影响图像语义的目标,使得图像文本描述网络能够生成不同的描述语句,丰富描述语句的多样性。
附图说明
图1是本发明方法的总体结构流程框图;
图2是本发明方法中待描述的原始图像Image;
图3是本发明方法中通过PoolNet网络得到的目标显著性图;
图4是本发明方法中通过Context-Aware Saliency Detection方法得到的语义显著性图;
图5是本发明方法中的融合显著性图;
图6是本发明方法中Faster R-CNN网络获取检测目标特征流程图;
图7是本发明方法中生成的目标节点关系示意图;
图8是本发明方法中生成多条描述语句流程示意图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
参照图1,本发明的方法,按照以下步骤实施:
步骤1、表达待描述图像的目标重要性,具体过程是,
1.1)将需要进行文本描述的原始彩色图像Image输入PoolNet网络,(该PoolNet网络为现有技术,可在公开发表的论文中检索到),PoolNet网络输出的是描述了原始彩色图像Image中重要目标的灰度图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110816869.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





