[发明专利]一种面向任意方向和形状的文本检测方法在审

申请号：	201911034756.7	申请日：	2019-10-29
公开（公告）号：	CN110766008A	公开（公告）日：	2020-02-07
发明（设计）人：	严海;贾昌鑫	申请（专利权）人：	北京华宇信息技术有限公司
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/34;G06K9/62
代理公司：	11640 北京中索知识产权代理有限公司	代理人：	胡大成
地址：	100084 北京市海淀区中关村***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种面向任意方向和形状的文本检测方法，包括人工合成数据训练阶段、弱监督训练阶段和测试阶段，针对有字符标注框的原始数据图像采用人工合成数据训练阶段进行训练，针对只有词级标注框没有字符标注框的原始数据图像，采用弱监督训练阶段进行训练。本发明可以更好的检测目标较大的文本。同时，在后置处理时对检测到的相邻较近的文本框进行连接操作，有效的减少了文本检测的间断问题。
搜索关键词：	数据训练阶段原始数据图像文本检测训练阶段字符标注测试阶段后置处理连接操作标注框文本框检测文本监督
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种面向任意方向和形状的文本检测方法，其特征在于：包括人工合成数据训练阶段和测试阶段，针对有字符标注框的原始数据图像采用人工合成数据训练阶段进行训练，所述的人工合成数据训练阶段包括：/n步骤S1、根据字符标注框对每幅原始数据图像生成独立的区域高斯热力图；/n步骤S2、每两个相邻的字符标注框组成一个字符标注框对，对每个字符标注框对生成连通性高斯热力图；/n步骤S3、对原始数据图像进行数据增强处理，增强处理的方式包括但不限于随机裁剪、随机旋转和颜色转换；/n步骤S4、将增强处理过的数据图像输入CRAFT网络模型中进行训练，得到CRAFT强文本检测模型；/n所述的测试阶段包括：/n步骤S5、将待检测的图像输入CRAFT强文本检测模型中，CRAFT强文本检测模型输出待检测图像中各区域存在文字的概率分数图以及文字连通的概率分数图；/n步骤S6、将存在文字的概率分数图和文字连通的概率分数图进行相加，使用连通域算法对相加后的分数图分割出文字区域前景和非文字区域背景；/n步骤S7、根据文字区域前景坐标求出所属区域的最小矩形，然后根据对应的坐标变换，将所述最小矩形转换至原始数据图像，进而得到图像中的文字区域；/n步骤S8、对所述文字区域处理得到文本检测框；/n步骤S9、对文本检测框排序，将同一行中相邻的文本检测框进行连接，合成一个统一的文本检测框。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京华宇信息技术有限公司，未经北京华宇信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201911034756.7/，转载请声明来源钻瓜专利网。

上一篇：证件遮挡检测方法、装置、设备及可读存储介质
下一篇：尾牌识别方法、装置以及计算机可读存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种面向任意方向和形状的文本检测方法在审

专利文献下载