[发明专利]图像矫正提示方法和装置、用户终端和存储介质在审
申请号: | 201910576194.2 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110287913A | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 吴恩泽 | 申请(专利权)人: | 京东数字科技控股有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06T7/80 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 王云飞;方亮 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 被拍摄物 图像矫正 特征点 矫正 方法和装置 存储介质 提示用户 像素坐标 用户终端 提示 图像 实际坐标 用户使用 识别率 相机 证件 输出 | ||
本公开涉及一种图像矫正提示方法和装置、用户终端和存储介质。该图像矫正提示方法包括:获取被拍摄物图像;计算图像中被拍摄物特征点的像素坐标;根据图像中被拍摄物特征点的像素坐标、被拍摄物特征点的实际坐标,确定被拍摄物矫正量;输出被拍摄物矫正量,以提示用户对被拍摄物进行矫正。本公开在用户使用相机识别证件等被拍摄物时,可以提示用户如何进行操作,以提高被拍摄物的识别率。
技术领域
本公开涉及光学字符识别领域,特别涉及一种图像矫正提示方法和装置、用户终端和存储介质。
背景技术
OCR(Optical Character Recognition,光学字符识别)技术是一种文字识别技术,可以将数字图片中出现的文本检测并识别出来,变成计算机能够接受并存储的格式,如字符串。光学字符识别技术有十分多的落地场景,如车牌识别,身份证识别等等,可以减少人工录入的步骤。
发明内容
申请人发现:相关技术在在识别身份证,银行卡等任务中,一般场景下都是用户拿着手机,使用手机的摄像头进行采集,并识别出结果。由于用户采集的时候,摄像头和证件的角度问题,可能导致无法识别,所以需要提示用户进行一定的调整,目前使用较多的方案是在使用边框来提示用户。即利用LSD(Line Segment Detector,直线段检测算法,一种直线提取算法)或者HED(Holistically-Nested Edge Detection,整体嵌套边缘检测,一种端对端的边缘检测算法)等检测直线的算法来检测证件的四条边,将检测出的边框变成绿色,当所有边框都是绿色的时候就是可以识别的情况。
相关技术利用四条边框来提示用户的方案,对于用户而言只是一个简单的判断手段,无法让用户得知无法识别的真正原因,以及无法根据当前的状态去提示用户该怎么样去旋转证件使得能够识别。
鉴于以上技术问题中的至少一项,本公开提供了一种图像矫正提示方法和装置、用户终端和存储介质,在用户使用相机识别证件等被拍摄物时,可以提示用户如何进行操作。
根据本公开的一个方面,提供一种图像矫正提示方法,包括:
获取被拍摄物图像;
计算图像中被拍摄物特征点的像素坐标;
根据图像中被拍摄物特征点的像素坐标、被拍摄物特征点的实际坐标,确定被拍摄物矫正量;
输出被拍摄物矫正量,以提示用户对被拍摄物进行矫正。
在本公开的一些实施例中,所述图像矫正提示方法还包括:
根据被拍摄物矫正量对被拍摄物图像进行矫正。
在本公开的一些实施例中,所述被拍摄物矫正量包括被拍摄物旋转角度和被拍摄物平移距离中的至少一项。
在本公开的一些实施例中,所述根据图像中被拍摄物特征点的像素坐标、被拍摄物特征点的实际坐标,确定被拍摄物矫正量包括:
获取相机内参矩阵;
根据图像中被拍摄物特征点的像素坐标、相机内参矩阵和被拍摄物特征点的实际坐标,确定相机外参矩阵,其中,所述相机外参矩阵包括旋转矩阵和平移矩阵中的至少一项;
根据所述相机外参矩阵确定被拍摄物矫正量。
在本公开的一些实施例中,所述相机内参矩阵包括在横轴和纵轴上每个像素所占的长度单位、相机焦距点坐标和镜头畸变参数。
在本公开的一些实施例中,所述获取相机内参矩阵包括:从用户终端系统接口获取相机内参矩阵。
在本公开的一些实施例中,所述获取相机内参矩阵包括:采用图片尺寸计算相机内参矩阵。
在本公开的一些实施例中,所述采用图片尺寸计算相机内参矩阵包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910576194.2/2.html,转载请声明来源钻瓜专利网。