[发明专利]一种面向任意方向和形状的文本检测方法在审

专利信息
申请号: 201911034756.7 申请日: 2019-10-29
公开(公告)号: CN110766008A 公开(公告)日: 2020-02-07
发明(设计)人: 严海;贾昌鑫 申请(专利权)人: 北京华宇信息技术有限公司
主分类号: G06K9/32 分类号: G06K9/32;G06K9/34;G06K9/62
代理公司: 11640 北京中索知识产权代理有限公司 代理人: 胡大成
地址: 100084 北京市海淀区中关村*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种面向任意方向和形状的文本检测方法,包括人工合成数据训练阶段、弱监督训练阶段和测试阶段,针对有字符标注框的原始数据图像采用人工合成数据训练阶段进行训练,针对只有词级标注框没有字符标注框的原始数据图像,采用弱监督训练阶段进行训练。本发明可以更好的检测目标较大的文本。同时,在后置处理时对检测到的相邻较近的文本框进行连接操作,有效的减少了文本检测的间断问题。
搜索关键词: 数据训练阶段 原始数据图像 文本检测 训练阶段 字符标注 测试阶段 后置处理 连接操作 标注框 文本框 检测 文本 监督
【主权项】:
1.一种面向任意方向和形状的文本检测方法,其特征在于:包括人工合成数据训练阶段和测试阶段,针对有字符标注框的原始数据图像采用人工合成数据训练阶段进行训练,所述的人工合成数据训练阶段包括:/n步骤S1、根据字符标注框对每幅原始数据图像生成独立的区域高斯热力图;/n步骤S2、每两个相邻的字符标注框组成一个字符标注框对,对每个字符标注框对生成连通性高斯热力图;/n步骤S3、对原始数据图像进行数据增强处理,增强处理的方式包括但不限于随机裁剪、随机旋转和颜色转换;/n步骤S4、将增强处理过的数据图像输入CRAFT网络模型中进行训练,得到CRAFT强文本检测模型;/n所述的测试阶段包括:/n步骤S5、将待检测的图像输入CRAFT强文本检测模型中,CRAFT强文本检测模型输出待检测图像中各区域存在文字的概率分数图以及文字连通的概率分数图;/n步骤S6、将存在文字的概率分数图和文字连通的概率分数图进行相加,使用连通域算法对相加后的分数图分割出文字区域前景和非文字区域背景;/n步骤S7、根据文字区域前景坐标求出所属区域的最小矩形,然后根据对应的坐标变换,将所述最小矩形转换至原始数据图像,进而得到图像中的文字区域;/n步骤S8、对所述文字区域处理得到文本检测框;/n步骤S9、对文本检测框排序,将同一行中相邻的文本检测框进行连接,合成一个统一的文本检测框。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华宇信息技术有限公司,未经北京华宇信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201911034756.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top