[发明专利]一种基于焦点损失函数的自然场景下文字检测定位方法和装置有效

专利信息
申请号: 201810729838.2 申请日: 2018-07-05
公开(公告)号: CN109117836B 公开(公告)日: 2022-05-24
发明(设计)人: 操晓春;田晓玮;伍蹈;代朋纹 申请(专利权)人: 中国科学院信息工程研究所
主分类号: G06V10/25 分类号: G06V10/25
代理公司: 北京君尚知识产权代理有限公司 11200 代理人: 邱晓锋
地址: 100093 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开一种基于焦点损失函数的自然场景下文字检测定位方法和装置。该方法首先对标注的数据进行预处理,然后构造文本检测定位网络,然后引用聚焦损失函数作为训练过程损失函数的一部分,然后对待检测的自然场景图片进行检测。该方法通过调整现有标注使标注更加适合所设计的文字检测网络;基于FCN网络将多卷积层进行合并,使之更加符合文字检测任务;通过引入聚焦损失函数在训练过程中平衡正负样本,提高检测精度。本发明能够在文字检测定位上取得高精度高召回的效果。
搜索关键词: 一种 基于 焦点 损失 函数 自然 场景 文字 检测 定位 方法 装置
【主权项】:
1.一种基于焦点损失函数的自然场景下文字检测定位方法,其特征在于,包括以下步骤:1)根据标注的自然场景图片的数据集,构造文字/背景二分类真值图以及文字像素与其所在文本框对应关系的五维真值图;2)基于FCN网络构造文字检测网络,所述文字检测网络的损失函数包含焦点损失函数和回归文本框的损失函数;3)利用构造的所述二分类真值图和所述五维真值图对所述文字检测网络进行训练;所述文字检测网络采用所述焦点损失函数逐像素进行分文字、背景的二分类,并采用所述回归文本框的损失函数对像素所在文本框的高度、宽度以及倾斜角度进行回归;4)将待检测的自然场景图片输入训练完成的文字检测网络,实现文字的检测定位。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810729838.2/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top