[发明专利]题册识别方法、系统、装置及介质有效
申请号: | 202110485611.X | 申请日: | 2021-04-30 |
公开(公告)号: | CN113205046B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 郭子滔;匡柘溪;王岩 | 申请(专利权)人: | 北京百舸飞驰科技有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V20/62;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 北京中联智道知识产权代理事务所(普通合伙) 11963 | 代理人: | 熊蒙 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 方法 系统 装置 介质 | ||
1.一种题册识别方法,其特征在于,包括:
获得待识别的题册图像并预先对所述题册的图像中题目所在位置进行初步确定,以清除所述题册图像中并非题目的干扰信息;
对清除干扰信息后的所述题册图像进行OCR识别,基于卷积神经网络定位每一个文本行并识别所述每一个文本行的内容,按照文本行排版顺序将识别的每一行文本内容进行串联得到OCR识别的文本信息的结果,以获取所述题册图像的文本信息;
根据分析所述文本信息以获取关键词,根据所述关键词进行检索得到具有相同关键词的资源题册的文本信息,以及,分析待识别的所述题册图像的文本信息与相应的每个资源题册的文本信息之间的共有文字并抽取共有文字对应的独有特征以确定一个或多个文字区分点对、并对一个或多个所述文字区分点对进行选择,根据每对文字区分点对中的文字周围像素变化梯度最大和/或文字处于特殊位置而将最具代表性的一个或多个所述文字区分点对中的文字区分点确定为对检索的结果进行处理的文字区分点;
其中,所述独有特征包括下列中的一种或多种:文字内容、文字周围的图像像素、文字内容和/或文字周围的图像的综合信息;
其中,所述文字区分点对表示在待识别的所述题册图像和每个资源题册的图像所展示的书页中、在相同位置出现了相同文字即为文字区分点,而位于待识别的所述题册图像所展示的书页和位于一资源题册所展示的书页的文字区分点就构成一对文字区分点对;
基于所述文字区分点对检索的结果进行处理和通过所述文字区分点匹配情况排序,以获得对应所述题册图像的识别结果。
2.根据权利要求1所述的题册识别方法,其特征在于,所述题册图像包括非完整的图像或完整的图像。
3.根据权利要求2所述的题册识别方法,其特征在于,所述文本信息的内容包括下列至少一项或多项:文字、字符、图形、背景。
4.根据权利要求1所述的题册识别方法,其特征在于,分析所述文本信息以获取关键词包括经过神经网络模型ner执行预测和/或概率统计提炼关键词。
5.根据权利要求1至4中任一项所述的题册识别方法,其特征在于,基于所述文字区分点对检索的结果进行处理和通过所述文字区分点匹配情况排序,以获得对应所述题册的识别结果,具体包括:
至少基于最长公共子串和/或所述文字区分点的各个特征信息,将检索的结果进行排序,确定最终的检索结果候选集;
输出所述最终的检索结果候选集给用户作为所述题册的识别结果。
6.根据权利要求5所述的题册识别方法,其特征在于,还包括:
对检索的结果进行处理之前,至少通过整体文本信息匹配、基于文字区分点匹配概率和/或图像像素匹配概率指标确定检索的结果是否正确。
7.根据权利要求5所述的题册识别方法,其特征在于,还包括:
对输出所述最终的检索结果候选集之前,至少通过整体文本信息匹配、基于文字区分点匹配概率和/或图像像素匹配概率指标确定检索结果候选集中的结果是否正确。
8.一种电子装置,包括处理器和存储器,所述存储器用于存储计算机可执行程序,其特征在于:当计算机程序被所述处理器执行时,所述处理器执行如权利要求1至7中任一项所述的题册识别方法。
9.一种计算机可读介质,存储有计算机可执行程序,其特征在于,所述计算机可执行程序被执行时,实现如权利要求1至7中任一项所述的题册识别方法。
10.一种题册识别系统,其特征在于,包括:
输入处理模块,用于获得待识别的题册图像并预先对所述题册的图像中题目所在位置进行初步确定,以清除所述题册图像中并非题目的干扰信息;对清除干扰信息后的所述题册图像进行OCR识别,基于卷积神经网络定位每一个文本行并识别所述每一个文本行的内容,按照文本行排版顺序将识别的每一行文本内容进行串联得到OCR识别的文本信息的结果,以获取所述题册图像的文本信息;
检索确定模块,用于根据分析所述文本信息以获取关键词,根据所述关键词进行检索得到具有相同关键词的资源题册的文本信息,以及,分析待识别的所述题册图像的文本信息与相应的每个资源题册的文本信息之间的共有文字并抽取共有文字对应的独有特征以确定一个或多个文字区分点对、并对一个或多个所述文字区分点对进行选择,根据每对文字区分点对中的文字周围像素变化梯度最大和/或文字处于特殊位置而将最具代表性的一个或多个所述文字区分点对中的文字区分点确定为对检索的结果进行处理的文字区分点;其中,所述独有特征包括下列中的一种或多种:文字内容、文字周围的图像像素、文字内容和/或文字周围的图像的综合信息;其中,所述文字区分点对表示在待识别的所述题册图像和每个资源题册的图像所展示的书页中、在相同位置出现了相同文字即为文字区分点,而位于待识别的所述题册图像所展示的书页和位于一资源题册所展示的书页的文字区分点就构成一对文字区分点对;
输出处理模块,用于基于所述文字区分点对检索的结果进行处理和通过所述文字区分点匹配情况排序,以获得对应所述图像的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百舸飞驰科技有限公司,未经北京百舸飞驰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110485611.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:题目生产方法、装置和电子设备
- 下一篇:题目生产方法、题目管理系统及电子设备