[发明专利]一种基于可微分二值化的实时文本检测方法有效
申请号: | 201911038562.4 | 申请日: | 2019-10-29 |
公开(公告)号: | CN110781967B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 白翔;廖明辉;万昭祎;姚聪 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V30/148;G06N3/08;G06N3/04 |
代理公司: | 深圳市六加知识产权代理有限公司 44372 | 代理人: | 向彬 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于可微分二值化的实时文本检测方法。通过对图像进行分割,得到文本区域的概率图,对概率图采用可微分二值化得到二值图,在二值图上寻找联通区域即可得到文本区域的包围盒。本方法通过给概率图和二值图均施加监督,将二值化的过程纳入训练之中,提升检测效果。本发明相对于现有文本检测方法,在准确度、运行效率和通用性方面都取得了卓越效果,有很强的实际应用价值。 | ||
搜索关键词: | 一种 基于 微分 二值化 实时 文本 检测 方法 | ||
【主权项】:
1.一种基于可微分二值化的实时文本检测方法,其特征在于,所述方法包括下述步骤:/n(1)训练基于可微分二值化的实时文本检测方法的网络模型,包括如下子步骤:/n(1.1)准备具有文本位置标注的训练数据集,位置的表示方式是水平的矩形或者任意的多边形;/n(1.2)定义场景文本检测网络模型,使用步骤(1.1)中适应于批量训练的带标注训练数据集,设计损失函数,选择参数优化器,利用反向传导方法训练该网络,得到场景文本检测网络模型;包括:/n(1.2.1)构建基于可微分二值化的场景文本检测网络模型,所述网络模型由基本特征提取模块、概率图预测模块、阈值图预测模块和二值化模块组成;/n(1.2.2)生成分割图和阈值图的训练标签,所述分割图的训练标签被用于概率图预测模块生成概率图,所述阈值图的训练标签被用于阈值图预测模块生成阈值图;/n(1.2.3)以标准训练数据集I
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911038562.4/,转载请声明来源钻瓜专利网。