[发明专利]一种基于旋转敏感特征的文本回归检测方法有效
申请号: | 201810195630.7 | 申请日: | 2018-03-09 |
公开(公告)号: | CN108427924B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 白翔;廖明辉;朱臻;石葆光;许永超;杨洋;徐培 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06N3/04 |
代理公司: | 深圳市六加知识产权代理有限公司 44372 | 代理人: | 严泉玉 |
地址: | 430070 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于旋转敏感特征的文本回归检测方法,通过方向响应卷积网络得到旋转敏感特征,用于包围盒的回归任务,得到包围盒的位置信息;然后,通过方向响应池化,将旋转敏感特征转化为旋转不变特征,用于包围盒的分类任务,得到包围盒是否属于文本的类别信息;最后,仅需简单后处理即可得到检测结果。该方法对于分类和回归区分设计的特征能适应自然场景图片里任意变化角度的文本,并且可以端到端训练,这种将分类和回归不共享特征的方法也可以应用到一般物体检测的框架中。本发明提出的检测方法相对于现有技术思路新颖,在准确度和通用性这些方面都取得了卓越的效果,有很强的实际应用价值。 | ||
搜索关键词: | 一种 基于 旋转 敏感 特征 文本 回归 检测 方法 | ||
【主权项】:
1.一种基于旋转敏感特征的文本回归检测方法,其特征在于,所述方法包括下述步骤:(1)训练基于旋转敏感特征的文本回归检测网络模型,包括如下子步骤:(1.1)对原始数据集中所有图片的多方向文本进行单词级别的标注,标签为单词级别的文本包围盒的四个顶点坐标,顶点为顺时针标注,其中文本包围盒为四边形,得到带标注的标准训练数据集;(1.2)定义基于旋转敏感特征的文本回归检测网络模型,根据(1.1)带标注的标准训练数据集,计算训练标签,并设计损失函数,利用反向传导方法训练该文本回归检测网络,得到文本回归检测网络模型;包括:(1.2.1)构建基于旋转敏感特征的文本回归检测网络模型,所述检测网络模型由特征提取模块、回归分支和分类分支组成;(1.2.2)根据特征图在原图上产生水平初始包围盒,计算训练标签,包括位置偏移量和类别;(1.2.3)以带标注的标准训练数据集Itr作为检测网络模型的输入,利用特征提取模块提取旋转敏感特征;(1.2.4)将旋转敏感特征输入分类分支,通过池化操作得到旋转不变特征,利用旋转不变特征预测初始包围的分类得分;(1.2.5)将旋转敏感特征输入回归分支,利用旋转敏感特征预测初始包围盒的位置偏移量;(1.2.6)以训练标签gt为网络期望输出,以预测标签
为网络预测输出,针对构建的网络模型,设计期望输出和预测输出之间的目标损失函数;(2)利用上述训练好的模型对待检测文本图片进行文字检测,包括如下子步骤:(2.1)对待检测图片进行分类预测和回归预测;(2.2)对预测的文本包围盒进行非最大值抑制操作进行过滤,得到输出结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810195630.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种掌纹识别方法及装置
- 下一篇:一种基于连续拷贝帧序列的拷贝视频检测方法