[发明专利]图像处理方法和装置在审
申请号: | 202210564943.1 | 申请日: | 2022-05-23 |
公开(公告)号: | CN114973258A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 王鹏;谢群义;钦夏孟;恩孟一;韩福永 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/19;G06V30/41 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 | ||
1.一种图像处理方法,包括:
获得包括沿第一方向排列的多个字符的目标图像,所述多个字符中的每一个字符来自预设字符集并且在预设标签集中具有相应的标签;
获得所述目标图像对应的识别结果集,所述识别结果集中的每一个识别结果包括来自所述预设标签集的按顺序排列的多个标签和该多个标签中的每一个标签的置信度;以及
基于所述识别结果集,获得所述目标图像的图像标签,所述图像标签包括来自所述预设标签集的按顺序排列的多个标签。
2.根据权利要求1所述的方法,其中,所述获得所述目标图像对应的识别结果集包括:
将所述目标图像分别输入至对应于多个分类的多个识别模型,以获得所述识别结果集,其中,
所述多个识别模型分别采用所述多个分类中的对应分类的多个训练图像训练而获得的,所述对应分类的多个训练图像中的每一个训练图像包括来自所述预设字符集中的多个字符。
3.根据权利要求2所述的方法,其中,所述多个分类包括对应于多个卡证类型的多个卡证分类、分别对应于多个医疗单据类型的多个医疗单据分类和/或分别对应于多个财务单据类型的多个财务单据分类。
4.根据权利要求1-3中任一项所述的方法,其中,所述基于所述识别结果集,获得所述目标图像的图像标签包括:
响应于所述识别结果集中的第一识别结果所包括的多个标签与第二识别结果所包括的多个标签相同并且与第三识别结果所包括的多个标签不同,获得多个识别结果子集,其中,在所述多个别结果子集中的每一个识别结果子集中,任一识别结果所包括的按顺序排列的多个标签与另一识别结果所包括按顺序排列的多个标签相同;以及
基于所述多个识别结果子集,获得所述图像标签。
5.根据权利要求4所述的方法,其中,所述基于所述多个识别结果子集,获得所述图像标签包括:
响应于所述多个识别结果子集中的第一识别结果子集的标签数量不小于任一识别结果子集的标签数量,将所述第一识别结果子集确定为候选识别结果子集,其中,所述多个识别结果子集中的每一个识别结果子集的标签数量为该识别结果子集所对应的按顺序排列的多个标签的数量;以及
基于所述多个识别结果子集中的一个或多个候选识别结果子集,获得所述图像标签。
6.根据权利要求5所述的方法,其中,所述基于所述多个识别结果子集中的一个或多个候选识别结果子集,获得所述图像标签包括:
针对所述一个或多个候选识别结果子集中的每一个候选识别结果子集,基于该候选识别结果子集的多个识别结果,获得该候选识别结果子集所对应的按顺序排列的多个标签中的每一个标签的统计置信度;以及
基于所述一个或多个候选识别结果子集中的每一个候选识别结果子集所对应的按顺序排列的多个标签和该多个标签中的每一个标签的统计置信度,获得所述图像标签。
7.根据权利要求6所述的方法,其中,所述基于该候选识别结果子集的多个识别结果,获得该候选识别结果子集所对应的按顺序排列的多个标签中的每一个标签的统计置信度包括:
针对该候选识别结果子集所对应的多个标签中的第一标签,获得所述第一标签在该候选识别结果子集中的多个识别结果中的多个置信度;
对所述多个置信度进行矫正,以获得多个矫正置信度;以及
基于所述多个矫正置信度,获得所述第一标签的统计置信度。
8.根据权利要求7所述的方法,其中,所述对所述多个置信度进行矫正包括:
基于所述多个置信度,获得所述多个识别结果对应的多个权重;
针对所述多个置信度中的每一个置信度,基于所述多个权重中的与该识别结果相应的权重进行加权,以获得所述第一标签的多个加权置信度;以及
基于所述多个加权置信度,获得所述多个矫正置信度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210564943.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序