[发明专利]一种识别标签的方法及装置有效
申请号: | 201610061356.5 | 申请日: | 2016-01-28 |
公开(公告)号: | CN107016387B | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | 常江龙;陈雪峰;叶进进;刘裕峰;冯玉玺;杨现;张侦 | 申请(专利权)人: | 苏宁云计算有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 许峰;苏一帜 |
地址: | 210042 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 标签 方法 装置 | ||
本发明实施例公开了一种识别标签的方法及装置,涉及图像识别技术领域,能够提高识别的准确率。本发明包括:读取拍摄得到的标签图像,并从所述标签图像中提取待筛选区域;根据文本特征在所述待筛选区域中确定单文本行区域,所述文本特征包括其中至少一项:文本行的长度、文本面积占比、梯度占比和文本在单文本行区域的相对位置;识别所述单文本行区域中的目标字符得到目标字符集合,并根据所述目标字符集合生成待输出的标签文本。本发明适用于印刷标签的识别。
技术领域
本发明涉及图像识别技术领域,尤其涉及一种识别标签的方法及装置。
背景技术
不论是在实体店内,还是在网购时展现的商品照片中,商品表面印刷的价签、商标图案等商品标签都是用于显示商品信息的重要渠道,为顾客了解商品起着最为直观的作用。并且,随着比价插件、拍照检索等标签检索技术的大规模应用,为用户提供了方便快捷的信息查询手段,其中对标签识别的准确率决定了查询结果的准确与否。
目前常用的标签中往往包含有商品的条形码或者二维码等信息,以便于通过智能设备扫描这类信息获得商品信息。但由于不同商品或是不同厂商提供的标签在格式上存在非常大的差异,很多标签并不包含有条形码或二维码等信息,只有文字或图案。而对于标签上的文字,主要是利用OCR(Optical Character Recognition,光学字符识别)技术进行文字提取和识别。
但是,OCR技术主要适用在拍摄条件较为标准的标签图像上,难以解析/识别具有复杂的线框,或是文字存在畸变、残缺、污染、断裂、光照不均、黏连等问题的标签。尤其是在超市、菜场等需要用户自行拍摄的场景中,由于拍摄水平的高低有别、实物商品标签的复杂程度不一、标签污损等问题,导致目前的标签识别方案在实际使用过程中识别的准确率很低。
发明内容
本发明的实施例提供一种识别标签的方法及装置,能够提高识别的准确率。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明的实施例提供一种识别标签的方法,包括:
读取拍摄得到的标签图像,并从所述标签图像中提取待筛选区域;
根据文本特征在所述待筛选区域中确定单文本行区域,所述文本特征包括其中至少一项:文本行的长度、文本面积占比、梯度占比和文本在单文本行区域的相对位置;
识别所述单文本行区域中的目标字符得到目标字符集合,并根据所述目标字符集合生成待输出的标签文本。
结合第一方面,在第一方面的第一种可能的实现方式中,所述从所述标签图像中提取待筛选区域,包括:
对所述标签图像进行边缘检测,得到所述标签图像的轮廓图;
对所述标签图像的轮廓图进行二值化处理,得到边缘二值图,所述二值化处理包括:通过不同颜色分别标记所述轮廓图中的背景和边缘;
对所述边缘二值图进行填充,得到填充边缘二值图,其中,在所述填充边缘二值图中具有同一边缘的区域闭合;
在所述填充边缘二值图中进行边缘搜索,得到存在闭合轮廓的区域,并从所述存在闭合轮廓的区域中提取所述待筛选区域
结合第一方面,在第一方面的第二种可能的实现方式中,所述根据文本特征在所述待筛选区域中确定单文本行区域,包括:
在所述待筛选区域中,检测存在的单字区域,并得到单字区域集合;
过滤单字区域集合中异常区域,所述异常区域包括长宽比、宽度、长度、面积不符合所述文本特征的区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁云计算有限公司,未经苏宁云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610061356.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车辆ABS或ASR传感器转接头
- 下一篇:一种汽车电源连接线