[发明专利]公式符号识别方法及其装置有效

专利信息
申请号: 201010299216.4 申请日: 2010-09-30
公开(公告)号: CN102446267A 公开(公告)日: 2012-05-09
发明(设计)人: 郭育生;邹明福 申请(专利权)人: 汉王科技股份有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/72
代理公司: 暂无信息 代理人: 暂无信息
地址: 100193 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 公式 符号 识别 方法 及其 装置
【说明书】:

技术领域

发明涉及公式识别领域,特别涉及一种公式符号识别方法及其装置。

背景技术

在数学公式识别中,不仅存在大量的相似字符,还存在较多模糊的空间位置关系。如图1所示,符号‘2’可能被误识为‘z’、‘Z’等,符号‘2’的结构关系除了上角标结构关系外还可能被误识为水平结构关系。因此,仅仅使用字符识别技术很难有效地识别出正确的字符,通过空间位置分析也难以确定符号的结构关系。目前,语言模型的概率统计技术应用最多的是统计字符之间的语言概率,但是该方法只能区分相似字符如‘2’和‘Z’,不能区分字符‘2’和前一个符号之间的位置关系如上角标和水平。

发明内容

本发明所要解决的技术问题是提供一种提高数学公式识别准确率的公式符号识别方法及其装置。

根据本发明的一个方面提供一种公式符号识别方法可包括:

通过字符识别技术识别公式中的公式符号β,给出公式符号β对应的识别候选α,给出所述识别候选α的符号相似程度值;

计算所述公式符号β对应的所述识别候选α在公式结构g上的语言概率;

根据所述符号相似程度值和所述语言概率确定符号识别候选α和/或所述符号识别候选α所在的公式结构。

根据本发明的另一个方面,提供一种公式符号识别装置可包括:

符号识别候选α确定模块,通过字符识别技术识别公式中的公式符号β,给出公式符号β对应的识别候选α;

相似程度值确定模块,给出所述识别候选α的符号相似程度值;

语言概率计算模块,计算所述公式符号β对应的所述识别候选α在公式结构g上的语言概率;

确定模块,根据所述符号相似程度值和所述语言概率确定符号识别候选α和/或所述符号识别候选α所在的公式结构。

根据本发明提供的公式符号识别方法及其装置,不仅可以有效地区分数学公式中的相似符号,还可以区分数学公式中的模糊结构,提高了数学公式识别的正确率。

附图说明

图1是公式符号X2中上标2可能被识别的符号及结构的示意图;

图2是本发明实施例提供的一种公式符号识别方法的流程示意图;

图3是图2所示方法中计算所述公式符号β对应的识别候选α在公式结构g上的语言概率的流程示意图;

图4是图3所示方法中计算公式结构g在语料库中的语言概率P(g)的流程示意图;

图5是图3所示方法中计算公式结构g、公式符号β的识别候选α同时出现在语料库中的语言概率P(gá)的流程示意图;

图6是图2所示方法中根据符号相似程度值和语言概率确定符号识别候选α;

图7是本发明实施例提供的一种公式符号识别装置的结构框图;

图8是图7所示装置中语言概率计算模块的结构框图;

图9是图8所示语言概率计算模块中第一计算模块的结构框图;

图10是图8所示语言概率计算模块中第二计算模块的结构框图;

图11是图7所示装置中确定模块结构框图;

本发明目的、功能及优点将结合实施例,参照附图做进一步说明。

具体实施方式

如图2所示,本发明实施例提供的一种公式符号识别方法可包括以下步骤:

步骤S1、通过字符识别技术识别公式中的公式符号β,给出公式符号β对应的识别候选α,给出识别候选α的符号相似程度值。例如,针对X2中的上标2给出‘2’、‘z’及‘Z’的识别候选,可针对‘2’、‘z’及‘Z’分别给出符号相似程度值,如‘2’的符号相似程度值为100,‘z’的符号相似程度值为50,‘Z’的符号相似程度值为30。

步骤S2、计算公式符号β对应的识别候选α在公式结构g上的语言概率。该步骤将结合图3~图5所示的流程进行详细说明。

步骤S3、根据所述符号相似程度值和语言概率确定符号识别候选α和/或所述符号识别候选α所在的公式结构。该步骤将结合图6所示的流程进行详细说明。

如图3所示,上述步骤S2计算公式符号β对应的识别候选α在公式结构g上的语言概率又可包括如下步骤:

步骤S21、计算公式结构g在语料库中的语言概率P(g)。该步骤将结合图4所示的流程进行详细说明。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉王科技股份有限公司,未经汉王科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010299216.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top