[发明专利]一种基于自适应特征选择和尺度损失函数的文本检测方法有效
申请号: | 202110341740.1 | 申请日: | 2021-03-30 |
公开(公告)号: | CN112926582B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 吴秦;骆文莉;柴志雷;肖志勇;陈璟;刘登峰 | 申请(专利权)人: | 江南大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 王晓东 |
地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自适应 特征 选择 尺度 损失 函数 文本 检测 方法 | ||
1.一种基于自适应特征选择和尺度损失函数的文本检测方法,其特性在于,包括:
利用主干网络获取图像中的文本特征,并通过特征金字塔网络进行基础特征的提取;
利用自适应特征选择,从所述基础特征中提取更具有代表性的特征信息;
利用渐进式扩张算法将所述具有代表性的特征信息进行分割、扩展,并获得最终检测结果;
使用文本实例的近似高度来设计不同文本的权重,在计算不同数据集中文本实例的高度时,需要设置不同的公式来进行计算,根据所述文本实例的高度,计算同一图像中所有文本实例的平均高度B为:
其中:Q为同一图像中文本实例的数量,He为第e个文本实例的近似高度;
不同的文本实例对所述损失函数会产生不同的影响,因此需要给不同的文本实例Te分配不同的权重μe,所述权重μe的计算公式为:
文本实例Te的权重μe与文本实例的平均高度B成反比;
对于非文本像素,权重设置为0,确定每个像素的权重后,反映文本比例信息的损失LH可表示为:
LH=1-Dice(Sn·M·μ,Gn·M·μ)
其中:M为由“在线难例挖掘(OHEM)”选择的训练掩码,μ为每个图像的权重矩阵,Sn是规模最大的分割结果,Gn为对应的标签。
2.如权利要求1所述的基于自适应特征选择和尺度损失函数的文本检测方法,其特征在于:所述利用主干网络获取图像中的文本特征包括,
所述主干网络为可形变卷积网络,在网络的最后三个阶段,使用3*3的可形变卷积代替一般的卷积,以适应物体的几何形状。
3.如权利要求1或2所述的基于自适应特征选择和尺度损失函数的文本检测方法,其特征在于:所述通过特征金字塔网络进行基础特征的提取包括,
将所述获取的文本特征C2、C3、C4、C5通过特征金字塔网络,得到不同尺度的特征图P2、P3、P4、P5,且每个尺度特征的通道数为256,再将P3、P4、P5分别经过2、4、8倍上采样得到和P2相同尺寸的特征图,最后将这4个相同尺寸的特征图进行连接操作得到后续处理的基本特征X,且X的尺寸是输入原图的1/4,所述基本特征的通道数是1024。
4.如权利要求3所述的基于自适应特征选择和尺度损失函数的文本检测方法,其特征在于:所述利用自适应特征选择提取更具有代表性的特征信息包括,
利用自适应特征选择模块,增强文本相关的特征,抑制与文本无关的特征,将所述从特征金字塔网络中获取的基础特征设置为:
X=[X1,X2,…,XC],X∈RC×H×W
其中:C为特征图的通道数,H、W分别为特征图的高度和宽度,利用全局平均池化操作,计算所述基本特征的通道中每一个通道的特征图中所有像素的特征的平均值,输出代表相应通道特征图的值:
z=[z1,z2,…,zC]T
使用两个全连接层捕捉不同通道间的权重,两个全连接之后的输出公式为:
v=σ(W2δ(W1z))
其中:σ、δ分别为ReLU和Sigmoid操作,并且z∈RC,为了减少参数,第一个全连接层的通道被减少到r设置为16,根据所述基本特征X上应用通道权重来得到自适应特征
的计算公式如下所示:
将特征X和相加来得到特征图F。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110341740.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种与翻车机配套的阻燃剂喷洒设备
- 下一篇:线缆通信装置及具有其的潜水设备