[发明专利]一种基于旋转敏感特征的文本回归检测方法有效
申请号: | 201810195630.7 | 申请日: | 2018-03-09 |
公开(公告)号: | CN108427924B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 白翔;廖明辉;朱臻;石葆光;许永超;杨洋;徐培 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06N3/04 |
代理公司: | 深圳市六加知识产权代理有限公司 44372 | 代理人: | 严泉玉 |
地址: | 430070 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 旋转 敏感 特征 文本 回归 检测 方法 | ||
1.一种基于旋转敏感特征的文本回归检测方法,其特征在于,所述方法包括下述步骤:
(1)训练基于旋转敏感特征的文本回归检测网络模型,包括如下子步骤:
(1.1)对原始数据集中所有图片的多方向文本进行单词级别的标注,标签为单词级别的文本包围盒的四个顶点坐标,顶点为顺时针标注,其中文本包围盒为四边形,得到带标注的标准训练数据集;
(1.2)定义基于旋转敏感特征的文本回归检测网络模型,根据(1.1)带标注的标准训练数据集,计算训练标签,并设计损失函数,利用反向传导方法训练该文本回归检测网络,得到文本回归检测网络模型;包括:
(1.2.1)构建基于旋转敏感特征的文本回归检测网络模型,所述检测网络模型由特征提取模块、回归分支和分类分支组成;具体地,特征提取模块由方向响应卷积网络组成,它以VGG16为基本网络,将常规卷积滤波器变换为主动卷积滤波器,其中,传统的卷积conv变换为方向响应卷积ORconv,包括13层:ORconv1_1、ORconv1_2、pool1、ORconv2_1、ORconv2_2、pool2、ORconv3_1、ORconv3_2,ORconv3_3、pool3、ORconv4_1、ORconv4_2、ORconv4_3,用于提取低层特征用于检测;后面为5个额外添加的卷积单元,包括10层:ORconv6、ORconv7、ORconv8_1、ORconv8_2、ORconv9_1、ORconv9_2、ORconv10_1、ORconv10_2、ORconv11_1、ORconv11_2,用于提取高层深度特征进行检测,其中ORconv4_3、ORconv7、ORconv8_2、ORconv9_2、conv10_2、ORconv11_2为6个待提取特征层;待提取特征层之后分别接入了回归分支模块和分类分支模块,其中回归分支包含感知块,它由m×m、m×n、n×m这三种尺度的卷积核组合而成,有利于适应多方向长文本的尺度和长宽比变化,三种卷积核输出的特征进行组合用于预测位置偏移量;分类分支模块包含池化层和感知块,感知块结构和回归分支相同,用于预测文本和非文本类别;
(1.2.2)根据特征图在原图上产生水平初始包围盒,计算训练标签,包括位置偏移量和类别;
(1.2.3)以带标注的标准训练数据集Itr作为检测网络模型的输入,利用特征提取模块提取旋转敏感特征;
(1.2.4)将旋转敏感特征输入分类分支,通过池化操作得到旋转不变特征,利用旋转不变特征预测初始包围盒的分类得分;
(1.2.5)将旋转敏感特征输入回归分支,利用旋转敏感特征预测初始包围盒的位置偏移量;
(1.2.6)以训练标签gt为网络期望输出,以预测标签为网络预测输出,针对构建的网络模型,设计期望输出和预测输出之间的目标损失函数;
(2)利用上述训练好的模型对待检测文本图片进行文字检测,包括如下子步骤:
(2.1)对待检测图片进行分类预测和回归预测;
(2.2)对预测的文本包围盒进行非最大值抑制操作以实现过滤,得到输出结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810195630.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种掌纹识别方法及装置
- 下一篇:一种基于连续拷贝帧序列的拷贝视频检测方法