[发明专利]一种文字查询方法、装置、计算机设备和存储介质在审
申请号: | 202211640669.8 | 申请日: | 2022-12-20 |
公开(公告)号: | CN115830611A | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 肖金辉;周多友;黄凯 | 申请(专利权)人: | 北京闪星科技有限公司 |
主分类号: | G06V30/18 | 分类号: | G06V30/18;G06V30/16;G06V30/146 |
代理公司: | 北京中知法苑知识产权代理有限公司 11226 | 代理人: | 李明 |
地址: | 100098 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 查询 方法 装置 计算机 设备 存储 介质 | ||
本公开提供了一种文字查询方法、装置、计算机设备和存储介质,其中,该方法包括:根据从待识别的目标图片中识别出的每个文字的文字信息,确定组成目标查询词的各个文字路径;所述文字信息包括文字位置和文字尺寸;根据每个所述文字路径中的各个目标文字的第一置信度、各个所述目标文字的文字信息和所述文字路径的偏转角度信息,确定所述文字路径的目标得分;根据每个所述文字路径的所述目标得分,确定所述目标图片的查询结果;所述查询结果用于指示所述目标图片中是否存在所述目标查询词。
技术领域
本公开涉及图像识别技术领域,具体而言,涉及一种文字查询方法、装置、计算机设备和存储介质。
背景技术
在图像识别领域中,通常存在查询图片中是否存在目标查询词的需求。为满足查询需求,常用的匹配方式为先利用文字识别(Optical Character Recognition,简称OCR)技术提取出图片中的文本,再利用文本重排算法将各个文本重排为一个文本字符串,最后利用匹配算法,对文本字符串进行文本匹配,以确定出图片是否存在目标查询词。
但是,针对上述匹配方式而言,不仅需要复杂的匹配步骤,还存在匹配结果不准确的问题,影响了文字查询的效果。
发明内容
本公开实施例至少提供一种文字查询方法、装置、计算机设备和存储介质。
第一方面,本公开实施例提供了一种文字查询方法,包括:
根据从待识别的目标图片中识别出的每个文字的文字信息,确定组成目标查询词的各个文字路径;所述文字信息包括文字位置和文字尺寸;
根据每个所述文字路径中的各个目标文字的第一置信度、各个所述目标文字的文字信息和所述文字路径的偏转角度信息,确定所述文字路径的目标得分;
根据每个所述文字路径的所述目标得分,确定所述目标图片的查询结果;所述查询结果用于指示所述目标图片中是否存在所述目标查询词。
在一种可能的实施方式中,所述根据每个所述文字路径中的各个目标文字的第一置信度、各个所述目标文字的文字信息和所述文字路径的偏转角度信息,确定所述文字路径的目标得分,包括:
根据所述文字路径中的每两个相邻目标文字的文字信息,确定相邻目标文字之间存在路径的第二置信度;
根据所述文字路径中的各个目标文字的所述第一置信度和每两个相邻目标文字对应的所述第二置信度,确定所述文字路径的第一得分;
根据所述第一得分和所述文字路径的所述偏转角度信息,确定所述文字路径的目标得分。
在一种可能的实施方式中,根据所述第一得分和所述文字路径的所述偏转角度信息,确定所述文字路径的目标得分,包括:
利用预设的得分转换规则,将所述偏转角度信息转换为第二得分;
根据所述第一得分和所述第二得分,确定所述文字路径的目标得分。
在一种可能的实施方式中,所述根据所述文字路径中的每两个相邻目标文字的文字信息,确定相邻目标文字之间存在路径的第二置信度,包括:
根据所述文字路径中的每两个相邻目标文字的文字信息中的文字尺寸,确定所述相邻目标文字之间的尺寸比例;
根据所述相邻目标文字的文字信息中的文字位置,确定所述相邻目标文字之间的文字距离;
对所述尺寸比例和所述文字距离进行归一化处理,得到所述相邻目标文字之间存在路径的所述第二置信度。
在一种可能的实施方式中,所述对所述尺寸比例和所述文字距离进行归一化处理,得到每两个相邻目标文字之间存在路径的所述第二置信度,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京闪星科技有限公司,未经北京闪星科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211640669.8/2.html,转载请声明来源钻瓜专利网。