[发明专利]一种文本图片矫正方法及装置在审
申请号: | 201910449861.0 | 申请日: | 2019-05-28 |
公开(公告)号: | CN112016341A | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 郑辉;熊龙飞;徐潇宇 | 申请(专利权)人: | 珠海金山办公软件有限公司;北京金山办公软件股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 丁芸;马敬 |
地址: | 519015 广东省珠海市高新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 图片 矫正 方法 装置 | ||
本发明实施例提供了一种文本图片矫正方法及装置,通过获取待矫正的文本图片,对文本图片进行文本行检测,得到各文本行在文本图片中的位置信息,根据各文本行的位置信息,计算各文本行对应于指定方向的偏转角度,根据各文本行对应于指定方向的偏转角度,基于预设数据统计策略,计算文本图片的矫正角度,基于矫正角度,旋转文本图片,得到矫正后的文本图片。整个文本图片的矫正角度是基于所有文本行的偏转角度计算得到的,矫正角度能够更为准确的反应各文本行的偏转,因此,在基于矫正角度对文本图片进行旋转时,能够保证尽可能多的文本行旋转至便于用户查看的方向,提高了矫正角度的准确性,矫正后的文本图片具有更为理想的矫正效果。
技术领域
本发明涉及图像处理技术领域,特别是涉及一种文本图片矫正方法及装置。
背景技术
随着电子技术的发展,经常需要对纸质文本进行拍照或扫描,以满足人们便于对文本进行查看、共享文本内容等需求。利用扫描仪、相机、传真机采集文本图片时,会由于文件放置角度、仪器精度、采集角度等原因出现不同程度的文本内容倾斜情况,采集的文本图片不便于后续的使用和进一步的图像处理。因此,需要对倾斜的文本图片进行矫正处理,将其矫正至水平位置。
相应的文本图片矫正方法,是在待矫正文本图片的文本区域同一边缘选取两个点,将两个点的坐标建立的直线与水平方向的夹角作为整个文本图片的矫正角度,根据矫正角度将文本图片旋转矫正至水平位置。
然而,在一些实际情况下,例如文本内容是手写的情况下,由于手写的不规范性,导致计算出的矫正角度与文本内容的实际偏转之间存在偏差,使得文本图片的矫正效果不理想。
发明内容
本发明实施例的目的在于提供一种文本图片矫正方法及装置,以提高矫正角度的准确性,实现文本图片理想的矫正效果。具体技术方案如下:
第一方面,本发明实施例提供了一种文本图片矫正方法,所述方法包括:
获取待矫正的文本图片;
对所述文本图片进行文本行检测,得到各文本行在所述文本图片中的位置信息;
根据所述各文本行的位置信息,计算所述各文本行对应于指定方向的偏转角度;
根据所述各文本行对应于指定方向的偏转角度,基于预设数据统计策略,计算所述文本图片的矫正角度;
基于所述矫正角度,旋转所述文本图片,得到矫正后的文本图片。
可选的,所述对所述文本图片进行文本行检测,得到各文本行在所述文本图片中的位置信息,包括:
对所述文本图片进行文本行检测,得到各文本行的检测框的顶点坐标信息;
根据所述各文本行的检测框的顶点坐标信息,确定所述各文本行在所述文本图片中的位置信息。
可选的,所述各文本行在所述文本图片中的位置信息,包括所述各文本行的顶点坐标信息;
所述根据所述各文本行的位置信息,计算所述各文本行对应于指定方向的偏转角度,包括:
根据所述各文本行的顶点坐标信息,通过将文本行首字符顶点和尾字符顶点进行连线,构建所述各文本行的文本行直线;
根据所述各文本行的文本行直线,利用三角函数关系,计算所述各文本行对应于指定方向的偏转角度。
可选的,所述根据所述各文本行对应于指定方向的偏转角度,基于预设数据统计策略,计算所述文本图片的矫正角度,包括:
统计所述各文本行对应于指定方向的偏转角度;
对所述各文本行对应于指定方向的偏转角度的统计结果进行取众数操作,得到所述文本图片的矫正角度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海金山办公软件有限公司;北京金山办公软件股份有限公司,未经珠海金山办公软件有限公司;北京金山办公软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910449861.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:遮阳帽
- 下一篇:一种生陶瓷切割装置及切割方法