[发明专利]题册识别方法、系统、装置及介质有效
申请号: | 202110485611.X | 申请日: | 2021-04-30 |
公开(公告)号: | CN113205046B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 郭子滔;匡柘溪;王岩 | 申请(专利权)人: | 北京百舸飞驰科技有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V20/62;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 北京中联智道知识产权代理事务所(普通合伙) 11963 | 代理人: | 熊蒙 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 方法 系统 装置 介质 | ||
本发明涉及图像识别技术领域,特别适用于包含内容的非完整影像的识别,针对现有的题册图像识别依赖于图像获取/采集本身状况,尤其是包含内容的图像不完整时识别效率和准确度都不理想甚至识别错误或无法识别,由此提出了本发明的题册识别方法、系统、装置及介质,旨在解决如何根据非完整页面的图像匹配完整的资源的技术问题。为此,本发明的方法通过从输入的包含非完整页面的题册图像获得的文本信息做分析后检索并确定文字区分点,再根据文字区分点对检索结果进行处理获得识别结果。由此,无论题册的图像是否完整,都不影响通过内容进行检索和识别的准确度和识别效率,保证了非完整页面图像匹配到完整资源,不过度依赖图像获取情况。
技术领域
本发明属于图像识别技术领域,特别适用于影像结合内容的识别,更具体的是涉及题册识别方法、系统、装置及介质。
背景技术
现有技术中的题册识别,依赖完整的、全面的图像采集(拍摄、摆放等)或者影像信息,才能提取准确的信息,确定对应的题册,给出识别结果。一旦已有的题册的影像本身存在缺陷,则不能保证页面的被识别的准确性,导致题册识别不准确,给出不准确的识别结果,甚至存在识别错误或无法识别的缺陷。
因此,为解决上述问题,提高用户体验,提出本申请,旨在解决的问题至少包括如何根据这不完整的页面信息去匹配完整的资源。
发明内容
(一)要解决的技术问题
本发明旨在解决如何根据不完整的页面信息确定对应的题册内容的技术问题,进而根据不完整的页面信息去匹配完整的资源;再进一步,可以对获取的题册整页影像或者存在上下文的题册页面影像,都通过检索分析更准确的判断用户使用的是哪本题册。
(二)技术方案
为解决上述技术问题,本发明的第一方面提出一种题册识别方法,包括:获取题册图像的文本信息;根据所述文本信息,进行检索并确定文字区分点;基于所述文字区分点对检索的结果进行处理,以获得对应所述图像的识别结果。
根据本发明的优选实施方式,获取题册的文本信息,具体包括:获得输入的待识别的题册的图像;对所述题册的图像进行OCR识别,得到所述题册图像的所述文本信息;其中,所述图像包括非完整的图像或完整的图像。
根据本发明的优选实施方式,对所述题册的图像进行OCR识别,具体包括:基于卷积神经网络定位每一个文本行并识别所述每一个文本行的内容;按照文本行排版顺序将识别的每一行文本内容进行串联得到OCR识别的所述文本信息的结果;其中,所述文本信息的内容包括下列至少一项或多项:文字、字符、图形、背景。
根据本发明的优选实施方式,获取题册图像的文本信息之前还包括:预先对所述题册的图像中题目所在粗略位置进行确定,以清除所述题册的图像中并非题目的干扰信息。
根据本发明的优选实施方式,根据所述文本信息,进行检索并确定文字区分点,具体包括:分析所述文本信息以获取关键词;根据所述关键词进行检索,得到具有相同关键词的每个资源题册的文本信息;分析所述文本信息与每个资源题册的文本信息之间的共有文字并抽取共有文字对应的独有特征,以确定一个或多个文字区分点对;对一个或多个所述文字区分点对进行选择,以将最具代表性的一个或多个所述文字区分点对中的文字区分点确定为对检索的结果进行处理的文字区分点;所述独有特征包括下列中的一种或多种:文字内容、文字周围的图像像素、文字内容和/或文字周围的图像的综合信息。
根据本发明的优选实施方式,对一个或多个所述文字区分点对进行选择至少包括:根据文字区分点对的文字周围像素变化梯度最大和/或文字处于特殊位置进行选择。
根据本发明的优选实施方式,基于所述文字区分点对检索的结果进行处理,以获得对应所述题册的识别结果,具体包括:基于最长公共子串和/或所述文字区分点的各个特征信息,将检索的结果进行排序,确定最终的检索结果候选集;输出所述最终的检索结果候选集给用户作为所述题册的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百舸飞驰科技有限公司,未经北京百舸飞驰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110485611.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:题目生产方法、装置和电子设备
- 下一篇:题目生产方法、题目管理系统及电子设备