[发明专利]图像识别方法及装置、存储介质和电子设备在审
| 申请号: | 202110895942.0 | 申请日: | 2021-08-05 |
| 公开(公告)号: | CN113780289A | 公开(公告)日: | 2021-12-10 |
| 发明(设计)人: | 唐景群;姜波;胡光龙;杨杨;吴凯琳;周密;洪伟 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
| 主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/46;G06K9/62;G06N3/08 |
| 代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
| 地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 识别 方法 装置 存储 介质 电子设备 | ||
本公开的实施方式提供了一种图像识别方法及装置、存储介质和电子设备,涉及图像识别技术领域。该方法包括:获取待识别图像的待识别图像分割特征;使用图像识别模型对待识别图像分割特征进行识别,以确定待识别图像的目标识别标签;其中,图像识别模型是通过图像训练数据中所提取的图像分割特征和图像分类特征训练获得的。本公开提供的图像识别方法可以提高图像中语种识别的准确性,为OCR的文字识别提供基础。
技术领域
本公开的实施方式涉及图像识别领域,更具体地,本公开的实施方式涉及图像识别方法及装置、存储介质和电子设备。
背景技术
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
光学字符识别(Optical Character Recognition,OCR)是对文本资料的图像文件进行分析识别处理,以获取文字及版面信息的过程。
由于在现实生活场景中,存在多种语言环境,例如,中文、藏文、维文、英文、日文、德文、韩文等。这些多语种的复杂场景直接影响了OCR 对文字识别结果的准确性。因此,对语种进行识别是OCR识别的基础。
然而现有的语种识别网络,识别的精度和兼容性较差,应用在OCR 中,无法满足OCR对识别精度的需求。
发明内容
在本上下文中,本公开的实施方式期望提供一种图像识别方法及装置、存储介质和电子设备。
在本公开实施方式的第一方面中,提供了一种图像识别方法,包括:
获取待识别图像的待识别图像分割特征;
使用图像识别模型对所述待识别图像分割特征进行识别,以确定所述待识别图像的目标识别标签;
其中,所述图像识别模型是通过图像训练数据中所提取的图像分割特征和图像分类特征训练获得的。
在本公开的一些实施例中,使用所述图像分割特征和所述图像分类特征对图像识别模型进行训练包括:
使用所述图像分类特征对图像识别模型进行训练,以获得分类识别标签;
使用带有所述分类识别标签的所述图像分类特征对所述图像识别模型进行再训练;
使用所述图像分割特征对再训练过的所述图像识别模型进行训练,以获得经训练的图像识别模型。
在本公开的一些实施例中,使用所述图像识别模型对所述待识别图像分割特征进行识别,以确定所述待识别图像的目标识别标签包括:
使用所述图像识别模型对所述待识别图像分割特征进行识别,获得所述待识别图像的分割识别标签;
根据所述待识别图像的分割识别标签,确定所述目标识别标签。
在本公开的一些实施例中,所述分类识别标签为图像整体标签,所述分割识别标签为图像中每个像素的像素标签。
在本公开的一些实施例中,根据所述待识别图像的分割识别标签,确定所述目标识别标签包括:
根据所述待识别图像的每个像素标签,将所述待识别图像中数量最大的像素标签,确定为所述待识别图像的目标识别标签。
在本公开的一些实施例中,所述像素标签还包括背景标签;所述方法还包括:
在确定所述待识别图像中数量最大的像素标签之前,剔除所述背景标签。
在本公开的一些实施例中,所述图像训练数据包括:带标签训练数据和无标签训练数据;所述方法还包括:
使用所述图像识别模型对所述无标签训练数据进行识别,确定识别结果的置信度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110895942.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





