[发明专利]一种数学公式识别方法、装置、设备及存储介质有效
| 申请号: | 201810921145.3 | 申请日: | 2018-08-14 |
| 公开(公告)号: | CN109241861B | 公开(公告)日: | 2022-02-25 |
| 发明(设计)人: | 曾金舟;何春江 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T3/40 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王云晓;王宝筠 |
| 地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数学公式 识别 方法 装置 设备 存储 介质 | ||
1.一种数学公式识别方法,其特征在于,包括:
获取待识别图像;
利用预设的公式判别规则和/或预先建立的公式判别模型,判别所述待识别图像是否为公式图像;
若所述待识别图像为公式图像,利用预先建立的公式识别模型从所述待识别图像中识别出目标公式;
其中,利用所述公式判别模型,判别所述待识别图像是否为公式图像,包括:
将所述待识别图像处理成多幅目标子图像;
将所述待识别图像的整幅图像信息和所述多幅目标子图像均作为公式判别模型的输入图像,输入所述公式判别模型,获得所述公式判别模型输出的、指示所述待识别图像是否为公式图像的判别结果,其中,所述公式判别模型根据输入的所述多幅目标子图像获知所述待识别图像中的内容在所述待识别图像中的分布情况,结合所述分布情况对所述待识别图像是否为公式图像做出判别。
2.根据权利要求1所述的数学公式识别方法,其特征在于,利用预设的所述公式判别规则和预先建立的所述公式判别模型,判别所述待识别图像是否为公式图像,包括:
先利用所述公式判别规则判别所述待识别图像是否为公式图像;
若利用所述公式判别规则判别出所述待识别图像为公式图像,则将所述待识别图像作为候选公式图像,进一步利用所述公式判别模型判别所述待识别图像是否为公式图像。
3.根据权利要求1或2所述的数学公式识别方法,其特征在于,所述利用所述公式判别规则判别所述待识别图像是否为公式图像,包括:
基于公式图像的尺寸和/或公式的几何特征,判别所述待识别图像是否为公式图像。
4.根据权利要求3所述的数学公式识别方法,其特征在于,基于所述公式的几何特征判别所述待识别图像是否为公式图像,包括:
对所述待识别图像进行二值化处理,二值化处理后的图像作为第一目标二值化图像;
在所述第一目标二值化图像中寻找连通体;
基于连通体之间的距离和/或连通体的高度,和/或,连通体在所述第一目标二值化图像中所占的面积,和/或,代表直线的连通体的数量,确定所述待识别图像是否为公式图像。
5.根据权利要求1或2所述的数学公式识别方法,其特征在于,所述将所述待识别图像处理成多幅目标子图像,包括:
确定所述待识别图像中字符的平均高度作为平均字符高度;
基于所述平均字符高度对所述待识别图像进行等比例缩放处理,获得缩放处理后的图像;
按预设的图像划分规则将所述缩放处理后的图像划分成多幅子图像;
分别以每幅子图像为中心构造预设尺寸的图像,获得多幅目标子图像。
6.根据权利要求5所述的数学公式识别方法,其特征在于,所述确定所述待识别图像中字符的平均高度作为平均字符高度,包括:
从所述待识别图像中确定高度大于预设值的字符作为目标字符;
统计所述目标字符的数量,并计算所有目标字符的高度的和;
通过所述目标字符的数量和所述所有目标字符的高度的和,确定所述平均字符高度。
7.根据权利要求1所述的数学公式识别方法,其特征在于,所述利用预先建立的公式识别模型从所述待识别图像中识别出目标公式,包括:
获取对所述待识别图像进行预处理后得到的预处理图像,并将所述预处理图像输入所述公式识别模型,获得所述公式识别模型输出的公式识别结果;
基于预设的字符规整规则对所述公式识别结果中不满足展示要求的字符进行规整,规整后得到所述目标公式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810921145.3/1.html,转载请声明来源钻瓜专利网。





