[发明专利]图片矫正方法、装置、电子设备及计算机可读存储介质有效

申请号：	202110477871.2	申请日：	2021-04-29
公开（公告）号：	CN113205090B	公开（公告）日：	2023-10-24
发明（设计）人：	韩光耀;姜泽青;陈禹燊;李治平	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06V30/146	分类号：	G06V30/146;G06V20/62
代理公司：	北京鸿德海业知识产权代理有限公司 11412	代理人：	谷春静
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	图片矫正方法装置电子设备计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供了图片矫正方法、装置、电子设备及计算机可读存储介质，涉及自然语言处理、深度学习及计算机视觉等人工智能领域，其中的方法可包括：对待处理的原始图片进行文字检测，得到检测出的文字框；根据文字框生成文本行；确定出文本行中的关键点，并根据关键点对预定参数进行更新；根据更新后的预定参数对原始图片进行重映射，得到矫正后的图片。本公开所述方案具有普遍适用性，并确保了处理结果的准确性。

技术领域

本公开涉及人工智能技术领域，特别涉及自然语言处理、深度学习及计算机视觉等领域的图片矫正方法、装置、电子设备及计算机可读存储介质。

背景技术

在对表格图片进行光学字符识别(OCR，Optical Character Recognition)时，对识别结果影响较大的一个因素即是由于拍照角度等导致的图片的扭曲或歪斜等。

为提升识别结果的准确性，可先对表格图片进行矫正。目前，通常采用基于深度学习的图片矫正方式。这种方式需要进行深度学习模型的训练，但对于训练得到的深度学习模型，通常仅对和训练集类似的图片具有较好的矫正效果，而对于其它图片的矫正效果则较差，即不具有普遍适用性。

发明内容

本公开提供了图片矫正方法、装置、电子设备及计算机可读存储介质。

根据本公开的一个方面，提供了一种图片矫正方法，包括：

对待处理的原始图片进行文字检测，得到检测出的文字框；

根据所述文字框生成文本行；

确定出所述文本行中的关键点，并根据所述关键点对预定参数进行更新；

根据更新后的预定参数对所述原始图片进行重映射，得到矫正后的图片。