[发明专利]一种车位图智能识别系统有效
申请号: | 202110282948.0 | 申请日: | 2021-03-16 |
公开(公告)号: | CN112668564B | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 孟宪坤;田文;宣卢斌 | 申请(专利权)人: | 杭州萝卜智能技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/34;G06K9/38;G06K9/46 |
代理公司: | 杭州信义达专利代理事务所(普通合伙) 33305 | 代理人: | 陈继算 |
地址: | 310016 浙江省杭州市余杭区余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 车位 智能 识别 系统 | ||
1.一种车位图智能识别系统,其特征在于,包括图像预处理模块、图像切分模块、文本区域检测模块、文本识别模块和车位信息展示模块:
图像预处理模块,分别利用高斯滤波、数字图像灰度处理技术、数字图像二值化对输入原始车位销控图进行预处理;
图像切分模块,接收图像预处理模块预处理的数字图像,使用轮廓识别函数和过滤函数识别符合要求的车位坐标信息,识别数字图像中的轮廓,判定是否为有效车位,筛选得到完整的车位坐标列表;
文本区域检测模块,接收图像切分模块中识别的结果,进行车位的局部数字图像获取,使用基于FCN实现的EAST算法检测车位编号文本信息所在区域;
文本识别模块,使用文本定位坐标信息对文本区域检测模块中的文本区域的内容使用opencv的threshold进行二值处理和文本识别,得到车位编号文本;
车位信息展示模块,把图像切分模块中识别到的车位坐标数据和文本识别模块得到的车位编号文本数据,输出前台系统作可视化展示。
2.根据权利要求1所述的一种车位图智能识别系统,其特征在于,所述图像预处理模块进行预处理的步骤包括:
A1,使用opencv的高斯滤波GaussianBlur对数字图像进行降噪处理;
A2,对降噪处理后的数字图像使用颜色空间转换函数cvtColor进行灰度化处理;
A3,对灰度处理的数字图像使用opencv的threshold进行二值处理,把数字图像转换成二值黑白图像。
3.根据权利要求2所述的一种车位图智能识别系统,其特征在于,还包括步骤A4,进行边缘增强处理,组合使用膨胀dilate、高斯滤波GaussianBlur、腐蚀erode进一步加强轮廓边缘。
4.根据权利要求1所述的一种车位图智能识别系统,其特征在于,所述图像切分模块中的过滤函数为:F(L,W),以矩形长宽为过滤因素,预设符合车位特征长(L)、宽(W),区间分别为[L1,L2]、[W1,W2]。
5.根据权利要求4所述的一种车位图智能识别系统,其特征在于,所述图像切分模块得到完整的车位坐标列表的步骤包括:
B1,调用opencv轮廓检测API识别图像预处理模块预处理后的数字图像,获取图上所有可能的轮廓;
B2,对可能的轮廓进行有效性判定:使用opencv的minAreaRect函数生成最小外接矩形,调用过滤函数判定是否为有效车位,完成车位坐标的筛选得到完整的车位坐标列表。
6.根据权利要求5所述的一种车位图智能识别系统,其特征在于,所述步骤B2中,根据所述最小外接矩形可以计算得到车位的方位信息,方位信息包括车位朝向、车位在车库中所处位置、车位的近似面积。
7.根据权利要求1所述的一种车位图智能识别系统,其特征在于,所述文本区域检测模块完成车位信息识别的步骤包括:
C1,使用单个车位坐标信息截取在原始车位销控图上的局部图像;
C2,使用基于FCN实现的EAST算法检测识别车位编号所在区域坐标信息;
C3,使用EAST文本检测器截取文字覆盖区域的局部图像作为车位编号识别的目标图像。
8.根据权利要求7所述的一种车位图智能识别系统,其特征在于,所述步骤C2中的基于FCN实现的EAST算法包括:特征提取、特征合并和输出层,输出层包括score map使用一个1*1的卷积输出分数图,rbox使用两个1*1卷积分别得到矩形的顶部、右侧、底部、左侧的距离以及一个边界框旋转角度,quad使用输出8个数字表示四边形的四个顶点到像素位置的坐标偏移。
9.根据权利要求1所述的一种车位图智能识别系统,其特征在于,所述文本识别模块得到车位编号文本的步骤包括:
D1,使用文本区域检测模块中的文本定位坐标信息对车位编号文本信息所在区域的内容使用opencv的threshold进行二值处理;
D2,使用tesseract进行文本识别,得到车位编号文本。
10.根据权利要求9所述的一种车位图智能识别系统,其特征在于,所述步骤D2中,还包括参数设定,参数设定有白名单设定、页面版面模式设定、OCR引擎设定;所述步骤D2中,具体为使用tesseract配合训练得到的识别库,进行文字识别操作,利用jTessBoxEditor把常见字体的对应数字样本作为输入图像,分别生成tif以及.box文件,然后再 生成.lstmf文件用于LSTM训练,提取lstm,使用样本数据训练并输出识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州萝卜智能技术有限公司,未经杭州萝卜智能技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110282948.0/1.html,转载请声明来源钻瓜专利网。