[发明专利]一种复杂背景图像中的文本提取方法有效

专利信息
申请号: 201310210040.4 申请日: 2013-05-29
公开(公告)号: CN103268481A 公开(公告)日: 2013-08-28
发明(设计)人: 达飞鹏;刘超;饶立;李燕春;吕江昭;王辰星;何学勇 申请(专利权)人: 焦点科技股份有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/46
代理公司: 江苏永衡昭辉律师事务所 32250 代理人: 齐旺
地址: 210003 江苏省南京*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种复杂背景图像中的文本提取方法。所述方法首先利用susan算子检测并标识出源图像中角点,将孤立角点去除后进行积分投影变换截取出疑似文本区域,依据先验知识筛选并去除非文本区域;再利用灰度跳变信息判断文本区域背景复杂度,当背景判断为复杂时,利用kmeans聚类算法对文本区域进行颜色聚类后,根据角点最密集位置的颜色信息确定文本所属的类并提取出来;当背景判断为简单时,利用最大类间方差法对图像进行二值化;最终实现文本区域的精确提取。本发明方法在复杂背景图像中定位出文本区域,将背景去除后最终将文字提取出来。
搜索关键词: 一种 复杂 背景 图像 中的 文本 提取 方法
【主权项】:
一种复杂背景图像中的文本提取方法,其特征在于,其步骤如下:步骤1:利用加权平均值法将源图像src灰度化,得到灰度图像Img;步骤2:检测灰度图像Img中的角点,将角点坐标存入角点容器中,构造角点矩阵;步骤3:去除角点矩阵中的孤立角点;步骤4:利用积分投影变换实现文本定位;步骤5:筛选并去除非文本区域;步骤6:从源图像src中截取出文本子图,判断文本子图的背景是否复杂;如果文本子图的背景判断为复杂,则执行步骤7;如果文本子图的背景判断为不复杂,则执行步骤8;步骤7:对背景复杂的文本子图进行颜色聚类,进而去除文本子图的背景后提取出文本信息;执行步骤9;步骤8:对背景不复杂的文本子图灰度化,再利用自适应阈值选取算法进行二值化,选取前景与背景区分阈值,提取图像文本子图的文本信息;步骤9:循环执行步骤6到步骤9,直到源图像src中所有文本子图的文本信息精确提取完成。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310210040.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top