[发明专利]一种书脊分割与文字识别系统及方法有效

专利信息
申请号: 202010910143.1 申请日: 2020-09-02
公开(公告)号: CN112116611B 公开(公告)日: 2022-07-05
发明(设计)人: 孙大洋;许文巍;张有丰 申请(专利权)人: 吉林大学
主分类号: G06T7/12 分类号: G06T7/12;G06T5/20;G06T3/60;G06T7/181;G06V20/62;G06V30/146;G06V30/148;G06V10/82;G06N3/04
代理公司: 重庆百润洪知识产权代理有限公司 50219 代理人: 刘立春
地址: 130000 吉*** 国省代码: 吉林;22
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 书脊 分割 文字 识别 系统 方法
【权利要求书】:

1.一种书脊分割与文字识别方法,其特征在于:包括:

步骤一、利用图像采集系统获取书脊图像image;

步骤二、将书脊图像image传入神经网络框架DarkNet中进行书脊分割,得到N个单书脊图像img1,img2…imgN;对每一个单书脊图像imgi执行如下步骤:(1)使用快速线检测算法对分割后的单书脊图像imgi进行直线检测得到直线组lines;(2)使用线拼接算法对直线组lines进行拟合,得到长度大于阈值的拟合直线组fitted_lines;具体步骤如下:

步骤1:调用快速线检测得到线检测结果lines;

步骤2:使用线长阈值MinLength与角度阈值slantAngle对线检测结果lines进行滤波得到滤波线组sortedlines,滤除长度小于线长阈值MinLength,角度小于角度阈值slantAngle的线;

步骤3:对滤波线组sortedlines按照线段首点的横坐标排序;

步骤4:对滤波线组sortedlines中所有未进行线拟合的线linei进行如下操作:

a)以线linei初始化拟合线段linetmp,标记线linei为已拟合;

b)遍历与线linei距离相差小于10*MinLength的线linej,如果线linej两端点与拟合线段linetmp的距离均小于拟合线距门限DisThreshold,则将线linej与线linei进行拟合,取线linej与线linej的最远端点更新拟合线段linetmp,标记线linej为已拟合;

c)如果拟合线段长度大于线长门限LineLength,将线拟合结果linetmp加入到拟合线段列表中;

步骤5:返回拟合线段列表;

(3)计算拟合直线组fitted_lines所有直线的角度平均值rotation_angle,并使用该平均值对单个书脊图像和直线组进行透射旋转变换得到旋转书脊图像rotated_imgi和旋转直线组rotated_lines;(4)使用卷积递归神经网络CRNN对旋转书脊图像rotated_imgi进行文字检测得到文字区域和文字内容;(5)使用文字区域对旋转直线组rotated_lines进行滤波,去除与文字区域相交的直线;(6)在滤波后的旋转直线组rotated_lines中找到距离旋转书脊图像rotated_imgi中心左侧最近的直线line1,距离旋转书脊图像rotated_imgi中心右侧最近的直线line2,并使用line1,line2对旋转书脊图像rotated_imgi进行裁剪;(7)使用直线line1和直线line2对文字区域与文字内容滤波,保留位置包含在line1,line2之间的文字识别结果;

步骤三、对书脊的文字识别结果进行数据库匹配;

步骤四、存储识别结果,按标记显示书脊图像。

2.一种书脊区域分割与文字识别系统,实现权利要求1所述的书脊分割与文字识别方法,其特征在于,所述系统包括:

图像采集系统,用于采集图书的书脊图像,并将采集到的书脊图像传输给图像分析系统;

图像分析系统,用于分析和处理图书的书脊图像,利用神经网络DarkNet框架进行书脊分割、记录坐标并保存分割的图像以及按照识别结果类型进行不同颜色的书脊框选显示;

文字识别系统,利用卷积递归神经网络CRNN对分割后的书脊进行文字区域识别及文字检测;

数据库交互系统,用于将图像分析系统得到的图像位置数据以及文字识别系统识别的数据与图书馆数据库做比对,并将比对结果恢复为可交互图像,存入数据库供管理员进行图书管理。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010910143.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top