[发明专利]一种图形识别的方法、装置及系统在审
申请号: | 201610659370.5 | 申请日: | 2016-08-11 |
公开(公告)号: | CN107729910A | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 张迎亚;刘巍;潘攀;华先胜 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/32 |
代理公司: | 北京同达信恒知识产权代理有限公司11291 | 代理人: | 郭润湘 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图形 识别 方法 装置 系统 | ||
技术领域
本申请涉及计算机领域,特别涉及一种图形识别的方法、装置及系统。
背景技术
随着计算机视频技术的发展,为了迎合用户的使用需求,物体检测技术在很多网站中都得到了充分利用,逐渐成为了网站服务中的一项重要内容。例如,无人驾驶装置通过物体检测技术识别视频中行人、车辆以及路标;又例如,网站服务器通过物体检测技术从用户输入的图片中识别用户感兴趣的物体;又例如,智能监控装置通过物体检测技术识别视频中行人、进行人脸检测等等。
广义地讲,物体检测是指自动定位图片或视频中指定的单个或者多个类别的物体。物体检测主要包括两个任务,识别图片或视频中所包含物体的类别以及定位物体的坐标位置。
以网站服务器采用的物体检测技术为例。目前,网站服务器通常会对物体进行分类,然后,在每一个类目下再进行物体检测。具体而言,网站服务器会针对每一个类目都预先训练一个分类器和坐标回归器。分类器用于对目标物体进行类目识别,而坐标回归器则用于在相应类目下,对物体在图片中的坐标位置进行识别,最后再基于识别出的坐标位置确定物体形状,再根据该物体形状进行物体检测。
然而,某些应用场景下(如,用户在网站中搜索希望购买的商品的图片),即使是归属同一类目下的物体,形状上的差异也比较大,如,在“裤子”这一类目下有长裤、短裤等等,又如,在“裙子”这一类目下有连衣裙,长裙、短裙等等。
针对这种类目,目前采用的物体检测方法中,通常使用单一的坐标回归器对归属于同一类目的不同物体进行坐标位置识别。但由于一个坐标回归器所使用的形状特征是通过海量的具有形状特征共性的样本数据训练得到的,因此,一个坐标回归器往往针对某一形状的物体可以进行坐标位置的准确识别。然而,由于归属于同一类目的物体在形状上也会存在较大差异,那么,采用单一坐标回归器进行坐标位置识别,会导致输出的坐标位置和实际的坐标位置之间偏差较大,从而进一步影响图形识别的准确性。
发明内容
本申请实施例提供一种图形识别的方法、装置及系统,用以提高图形识别的准确性。
本申请实施例提供的具体技术方案如下:
一种图形识别系统,包括:
客户端,用于获取待检测图片;
服务器,用于接收客户端传输的待检测图片,采用预设的各个形状样本,分别对所述待检测图片中包含的图形进行定位,获得相应的定位结果以及置信度,其中,一个形状样本对应的定位结果的置信度,表征所述一个形状样本和所述图形的相似度;基于所述置信度,获得相应的图形识别结果。
可选的,获取待检测图片时,所述客户端用于:
获取原始图片,并将所述原始图片作为待检测图片;或者,
获取原始图片,并按照设定方式在所述原始图片中截取指定区域,以及将所述指定区域作为待检测图片。
可选的,采用预设的各个形状样本,分别对所述待检测图片中包含的图形进行定位时,所述服务器用于:
采用预设的形状样本,分别对所述待检测图片中包含的图形进行定位;或者,
对所述待检测图片进行特征提取,根据提取结果确定所述待检测图片归属的类目,再基于对应所述类目预设的各个形状样本,分别对所述待检测图片中包含的图形进行定位。
可选的,采用预设的一个形状样本,对所述待检测图片中包含的图形进行定位,获得相应的定位结果时,所述服务器用于:
采用所述一个形状样本,在所述待检测图片中进行图形匹配;
确定存在匹配成功的图形时,按照所述一个形状样本,在所述图形的周边绘制边框;
确定所述边框的坐标位置,将所述坐标位置作为所述图形的定位结果。
可选的,获得所述定位结果的置信度时,所述服务器用于:
计算所述定位结果与所述图形的相似度,将所述相似度作为所述置信度,或者,对所述相似度进行误差处理,并将处理结果作为所述置信度。
可选的,基于所述置信度,获得相应的图形识别结果时,所述服务器用于:
将置信度最高的定位结果对应的形状样本作为图形识别结果。
可选的,服务器进一步用于:
基于所述图形识别结果,在预设范围内进行物体检测,筛选出与所述图形识别结果类似的物体。
一种图形识别方法,包括:
获取待检测图片;
采用预设的各个形状样本,分别对所述待检测图片中包含的图形进行定位,获得相应的定位结果以及置信度,其中,一个形状样本对应的定位结果的置信度,表征所述一个形状样本和所述图形的相似度;
基于所述置信度,获得相应的图形识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610659370.5/2.html,转载请声明来源钻瓜专利网。