[发明专利]一种增加图像文本描述多样性方法在审
| 申请号: | 202110816869.3 | 申请日: | 2021-07-20 |
| 公开(公告)号: | CN113657170A | 公开(公告)日: | 2021-11-16 |
| 发明(设计)人: | 朱虹;杜森;史静;张雨嘉;刘媛媛;王栋 | 申请(专利权)人: | 西安理工大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06F40/205;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 西安弘理专利事务所 61214 | 代理人: | 戴媛 |
| 地址: | 710048 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 增加 图像 文本 描述 多样性 方法 | ||
1.一种增加图像文本描述多样性方法,其特征在于,按照以下步骤实施:
步骤1、表达待描述图像的目标重要性;
步骤2、构建原始彩色图像Image中目标的相邻关系结构图,表达关联关系重要性;
步骤3、对检测到的目标进行筛选,得到文本描述网络需要的特征;
步骤4、将随机删除非重要目标后的β组目标检测框特征,输入图像文本描述网络,生成多条描述语句。
2.根据权利要求1所述的增加图像文本描述多样性方法,其特征在于,所述的步骤1中,具体过程是,
1.1)将需要进行文本描述的原始彩色图像Image输入PoolNet网络,PoolNet网络输出的是描述了原始彩色图像Image中重要目标的灰度图;
将原始彩色图像Image输入PoolNet网络后,得到目标显著性图,记作S1,S1=[s1(i,j)]H×W;目标显著性图中,每个像素点的灰度值表示该点的重要程度,越重要的物品的灰度值越大,重要目标是整幅图像中引起视觉关注的目标;
1.2)将需要进行文本描述的原始彩色图像Image再用Context-Aware SaliencyDetection方法,获得语义显著性图,记作S2,S2=[s2(i,j)]H×W;
1.3)将目标显著性图S1和语义显著性图S2相叠加,得到显著性图S,S=[s(i,j)]H×W,叠加公式如下:
按照公式(1)将图3和图4融合后得到的结果,显著性图S中重要目标的灰度值最高,周围环境次之;
1.4)通过Faster R-CNN网络对输入原始彩色图像Image进行目标检测,通过Faster R-CNN网络的RPN模块得到候选目标检测框kb=1,2,...,P,P为候选目标个数;之后通过非极大值抑制模块,得到最终保留下来的N个目标检测框,取这N个目标检测框boxk,k=1,2,...,N在FC6层后的特征,作为N个目标的特征,记作Xk,Xk=[x1,k,x2,k,...,xd,k]k=1,2,...,N,其中d为特征向量的维数;
1.5)计算N个目标检测框的显著性得分,每个目标检测框的显著性得分表示了该目标的重要程度,计算公式如下:
其中,表示第k个目标中的像素点的个数。
3.根据权利要求1所述的增加图像文本描述多样性方法,其特征在于,所述的步骤2中,具体过程是,
2.1)得到原始彩色图像Image中每个物品的检测框boxk,k=1,2,...,N后,计算第ib个检测框boxib和第jb个检测框boxjb之间的相邻关系IoU(ib,jb),公式如下:
其中,boxib∩boxjb是boxib和boxjb的交集区域,boxib∪boxjb是boxib和boxjb的并集区域;
2.2)当boxib和boxjb的IoU(ib,jb)>δ,δ为经验值,0.15≤δ≤0.3时,则认为这两个目标检测框中的目标存在关联;
2.3)将每个目标检测框视为一个节点,当两个目标检测框之间按照步骤2.2)判断为存在关联时,则这两个节点间存在一条边,由此构建目标关系图;
2.4)计算目标关系图中每个目标节点的度,度是节点上边的数量,当一个目标节点的度越大,表示与该目标相关联的其他目标越多,则表明该目标越重要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110816869.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





