[发明专利]图像文字检索方法及系统在审
申请号: | 201810837743.2 | 申请日: | 2018-07-26 |
公开(公告)号: | CN109189965A | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 喻民;姜建国;梁小霞;刘超;黄伟庆 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06K9/66;G06N3/04 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本区域 预设目标 预设 文字模型 文字图像 检索图像 图像文字 检索 连通区域分析 输出结果 文字检索 构建 节约 | ||
1.一种图像文字检索方法,其特征在于,包括:
S1,获取待检索图像中的多个文本区域;
S2,分别对所述多个文本区域中每一文本区域进行连通区域分析,得到每一文本区域中每个文字的文字图像;
S3,将每一文本区域中每个文字的文字图像分别输入至预设目标文字对应的预设单文字模型中,若对于任一文字的文字图像,所述预设单文字模型输出结果为第一预设数值时,则确定所述任一文字为所述预设目标文字;
其中,所述预设单文字模型是将目标文字集合中每一目标文字的文字图像均作为样本图像,采用深度学习方法对神经网络进行训练得到,所述目标文字集合中至少包括所述预设目标文字。
2.根据权利要求1所述的图像文字检索方法,其特征在于,所述S2具体包括:
对于所述多个文本区域中的任一文本区域,对所述任一文本区域进行连通区域分析,得到所述任一文本区域内的所有第一类连通区域;
计算所述所有第一类连通区域中每一第一类连通区域的宽高比,其中,每一宽高比在第一预设阈值范围内的第一类连通区域均作为一个文字的文字图像。
3.根据权利要求1所述的图像文字检索方法,其特征在于,所述样本图像包括第一类样本图像和第二类样本图像;
所述预设目标文字的文字图像为所述第一类样本图像,所述目标文字集合中除所述预设目标文字外的每一目标文字的文字图像均为所述第二类样本图像;
相应地,所述预设单文字模型是将目标文字集合中每一目标文字的文字图像均作为样本图像,采用深度学习方法对神经网络进行训练得到,具体包括:
将所有第一类样本图像作为所述神经网络的输入,将所述第一预设数值作为所述神经网络的输出结果,采用深度学习方法对所述神经网络进行训练;
同时,将所有第二类样本图像作为所述神经网络的输入,将第二预设数值作为所述神经网络的输出结果,采用深度学习方法对所述神经网络进行训练;
直至训练后的所述神经网络的准确率低于训练过程中已得到的神经网络的准确率中的最佳准确率时,结束训练。
4.根据权利要求1所述的图像文字检索方法,其特征在于,对于所述目标文字集合中任一目标文字,所述任一目标文字的文字图像包括:第一预设数量个字体种类的所述任一目标文字的文字图像和第二预设数量个字体尺寸的所述任一目标文字的文字图像。
5.根据权利要求1所述的图像文字检索方法,其特征在于,所述S1具体包括:
获取所述待检索图像的灰度图像,并将所述灰度图像转换为二值图像;
将所述二值图像进行膨胀操作,并对膨胀操作后的所述二值图像进行连通区域分析,获取所述二值图像中的所有第二类连通区域,并将宽度大于第二预设阈值且高度在第三预设阈值范围内的第二类连通区域均作为一个文本区域。
6.根据权利要求1-5中任一项所述的图像文字检索方法,其特征在于,所述目标文字集合中的目标文字的种类包括:国标一级汉字、数字和英文字母。
7.根据权利要求1-5中任一项所述的图像文字检索方法,其特征在于,在所述S3中确定所述任一文字为所述预设目标文字后,还包括:
将所述待检索图像的路径存储至所述预设目标文字对应的检索结果列表中。
8.一种图像文字检索系统,其特征在于,包括:
文本区域获取模块,用于获取待检索图像中的多个文本区域;
文字图像获取模块,用于分别对所述多个文本区域中每一文本区域进行连通区域分析,得到每一文本区域中每个文字的文字图像;
检索确定模块,用于将每一文本区域中每个文字的文字图像分别输入至预设目标文字对应的预设单文字模型中,若对于任一文字的文字图像,所述预设单文字模型输出结果为第一预设数值时,则确定所述任一文字为所述预设目标文字;
其中,所述预设单文字模型是将目标文字集合中每一目标文字的文字图像均作为样本图像,采用深度学习方法对神经网络进行训练得到,所述目标文字集合中至少包括所述预设目标文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810837743.2/1.html,转载请声明来源钻瓜专利网。