[发明专利]一种字符偏移检测方法及系统有效
申请号: | 202010431910.0 | 申请日: | 2020-05-20 |
公开(公告)号: | CN111680692B | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 李泽超;李煌;唐金辉 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V30/186 | 分类号: | G06V30/186;G06V30/148 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 陈鹏 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字符 偏移 检测 方法 系统 | ||
本发明公开了一种字符偏移检测方法及系统,所述方法包括:获取文本图像;基于所述文本图像进行字符分离,获得字符文本区域;计算所述字符文本区域中各矩形框的中心点,获得中心点集合;基于所述中心点集合确定最优拟合曲线;基于所述最优拟合曲线对字符偏移进行分析,获得偏移结果。所述系统包括获取模块、中心点集合确定模块、最优拟合曲线确定模块和偏移结果确定模块。本发明基于曲线拟合实现对字符偏移检测,提高检测的准确性。
技术领域
本发明涉及计算机视觉技术领域,特别是涉及一种字符偏移检测方法及系统。
背景技术
文本是人类信息的重要载体,是人类生活中不可缺少的一部分,它广泛存在于各类生活场景中。近年来,随着数字媒体技术的发展,各类场景的图片已然成为了信息交流的主要载体。同时,根据图像中的文本信息对图像进行分析的需求越来越广泛。
对于各类文本图像研究而言,现有的检测方法主要在于文本行的分析与研究,各类场景的文本检测基本止步于文本词条,主要任务是定位出一个文本行,但并未对字符进行分析。目前对字符分析也是极为重要的,特别是在各类表单中,印章或拓本的内容对整个表单信息将会产生极大的影响。对表单中印章类图像区域内的文本分布是存在一致性的,具体包括字体大小一致性及位置分布的一致性,分析该区域内的字符可以对这类图像的鉴伪提供有效的参考,但目前还没有具体技术方案公开如何对字符偏移进行分析。
发明内容
本发明的目的在于提供一种字符偏移检测方法及系统,以实现对字符偏移进行检测。
实现本发明目的的技术解决方案为:一种字符偏移检测方法,所述方法包括:
步骤S1:获取文本图像;
步骤S2:基于所述文本图像进行字符分离,获得字符文本区域;
步骤S3:计算所述字符文本区域中各矩形框的中心点,获得中心点集合;
步骤S4:基于所述中心点集合确定最优拟合曲线;
步骤S5:基于所述最优拟合曲线对字符偏移进行分析,获得偏移结果。
可选的,所述基于所述中心点集合确定最优拟合曲线,具体包括:
步骤S41:从所述中心点集合中选取起始点、终止点和中间某一点;
步骤S42:连接所述起始点和所述终止点获得第一直线,连接所述起始点和中间某一点获得第二直线;
步骤S43:确定所述第一直线和所述第二直线之间的夹角余弦;
步骤S44:基于所述夹角余弦寻找最优拟合曲线。
可选的,所述基于所述夹角余弦寻找最优拟合曲线,具体包括:
步骤S441:判断所述夹角余弦是否大于角度阈值;如果所述夹角余弦大于角度阈值,则说明某一字符所在位置相对整个文本区域发生了偏离,则执行“步骤S442”;如果所述夹角余弦小于或等于角度阈值,则将初始拟合曲线作为最优拟合曲线;
步骤S442:获取初始拟合曲线;
步骤S443:基于所述初始拟合曲线确定损失函数值;
步骤S444:判断所述损失函数值是否小于设定值;如果所述损失函数值小于设定值,则将所述初始拟合曲线作为最优拟合曲线;如果所述损失函数值大于或等于设定值,则更新所述初始拟合曲线中的斜率和偏移量,并将更新后的拟合曲线作为所述初始拟合曲线,并执行“步骤S443”。
可选的,所述基于所述最优拟合曲线对字符偏移进行分析,获得偏移结果,具体包括:
步骤S51:基于所述最优拟合曲线进行字符垂直偏移分析;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010431910.0/2.html,转载请声明来源钻瓜专利网。