[发明专利]一种图片生成方法与设备有效
| 申请号: | 201710742645.6 | 申请日: | 2017-08-25 |
| 公开(公告)号: | CN107679074B | 公开(公告)日: | 2021-05-04 |
| 发明(设计)人: | 谢术富;刘珊珊 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F16/583 | 分类号: | G06F16/583;G06K9/36 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨泽;刘芳 |
| 地址: | 100085 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 图片 生成 方法 设备 | ||
本申请的目的是提供一种图片生成方法及设备。其中,所述方法包括:获取第一图片对应的文字识别结果,其中,文字识别结果包括文字的第一置信度信息;根据文字集中文字的第一置信度信息确定文字集的第二置信度信息,其中,文字集包括一个或多个文字;根据第二置信度信息确定第一图片对应的优选文字集;对优选文字集在第一图片中对应的子图片进行图像处理,以获得第二图片。本申请通过筛选文字识别结果确定优选文字集,由此实现自动地确定样本图片的批注文字;同时,根据优选文字集从第一图片中选择子图片并进行图像处理,既帮助增加样本图片的数量又为搜索系统提供了包含多种图像清晰度、图像灰度、图像对比度等类型的样本图像。
技术领域
本申请涉及图像处理领域,尤其涉及一种图片生成方法及设备的技术。
背景技术
随着搜索技术的发展,人们已不限于实现文字搜索,一些基于图文结合、图片搜索的技术正在被深入研究。例如,利用图片的文字标签,用户输入搜索关键词即可找到与之相关的图片。然而,这种方式需要人工收集大量的图片标签,并将标签与图片关联,限于对有限图片进行搜索。对于海量搜索来说,上述方式所能找到的图片及其有限,而且效率很低。
与此同时,人工智能技术在多学科领域中得到了认可,其是一门用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的技术科学。将人工智能技术应用到搜索技术中需要为搜索系统提供学习机会。就图片搜索而言,需要提供充足的、能涵盖广泛搜索领域的图片供搜索系统学习,以提高搜索系统的自识别能力,显然,这需要人工广泛收集样本图片。对于技术人员来说收集样本图像与前述为图片配备文字标签都不是减轻工作、提高搜索准确率的有效方式。
发明内容
本申请的一个目的是提供一种图片生成方法及设备。
根据本申请的一个方面,提供了一种图片生成方法,包括:
a获取第一图片对应的文字识别结果,其中,所述文字识别结果包括一个或多个文字及每个文字的第一置信度信息;
b根据文字集中文字的第一置信度信息确定所述文字集的第二置信度信息,其中,所述文字集包括所述一个或多个文字中至少一个;
c根据所述第二置信度信息确定所述第一图片对应的优选文字集;
d对所述优选文字集在所述第一图片中对应的子图片进行图像处理,以获得第二图片,其中,所述第二图片对应的批注文字包括所述优选文字集。
优选地,所述步骤d包括:
根据所述优选文字集中文字的区域位置信息确定所述优选文字集在所述第一图片中对应的子图片;
对所述子图片进行图像处理,以获得第二图片,其中,所述第二图片对应的批注文字包括所述优选文字集。
优选地,所述文字识别结果还包括所述区域位置信息。
优选地,所述步骤c包括:
若所述第二置信度信息等于或大于集合置信度阈值,确定所述文字集为所述第一图片对应的优选文字集。
优选地,所述步骤c包括:
对多个所述文字集按所述第二置信度信息降序排列;
将序列中前N个文字集作为所述第一图片对应的优选文字集,其中N为自然数。
优选地,所述文字集满足以下至少任一项:
所述一个或多个文字中的一个文本行;
所述一个或多个文字中的多个文本行;
所述一个或多个文字中的一个文本行的部分;
所述文字集中的文字来自所述一个或多个文字中不同文本行。
优选地,所述步骤d包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710742645.6/2.html,转载请声明来源钻瓜专利网。





