[发明专利]一种图像矫正及文本与位置识别方法及系统有效

申请号：	201910119284.9	申请日：	2019-02-18
公开（公告）号：	CN109993160B	公开（公告）日：	2022-02-25
发明（设计）人：	何宁;孙欣	申请（专利权）人：	北京联合大学
主分类号：	G06V30/42	分类号：	G06V30/42;G06V30/16;G06V30/186;G06V30/244;G06N3/04
代理公司：	北京驰纳智财知识产权代理事务所(普通合伙) 11367	代理人：	谢亮
地址：	100101 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种图像矫正及文本与位置识别方法及系统，其中方法包括输入待检测图片，还包括以下步骤：检测所述待检测图片的文字角度，拟合直线，并统计所述直线的斜率，依据众数方向θ作为图片的矫正方向；利用仿射变换矩阵，对所述待检测图片进行位置旋转；使用faster‑rcnn定位技术对所述待检测图片的信息进行预识别；将预识别的目标区域输入卷积深度神经网络CLNN进行文字及其位置的精准识别；输出识别结果。本发明提出一种图像矫正及文本与位置识别方法及系统，基于神经网络的图像矫正及文本与位置识别模型，主要解决身份证、名片、表格图片等文本及其位置识别问题，以满足各行业应用需求，给用户带来更好的体验。
搜索关键词：	一种图像矫正文本位置识别方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种图像矫正及文本与位置识别方法，包括输入待检测图片，其特征在于，还包括以下步骤：步骤1：检测所述待检测图片的文字角度，拟合直线，并统计所述直线的斜率，依据众数方向θ作为图片的矫正方向；步骤2：利用仿射变换矩阵，对所述待检测图片进行位置旋转；步骤3：使用faster‑rcnn定位技术对所述待检测图片的信息进行预识别；步骤4：将预识别的目标区域输入卷积深度神经网络CLNN进行文字及其位置的精准识别；步骤5：输出识别结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京联合大学，未经北京联合大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910119284.9/，转载请声明来源钻瓜专利网。

上一篇：基于机器人的配送方法、装置、设备及可读存储介质
下一篇：一种文本图像旋转矫正方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种图像矫正及文本与位置识别方法及系统有效

专利文献下载