[发明专利]基于统一注意力机制的公式及文字识别模型方法在审

专利信息
申请号: 202011505069.1 申请日: 2020-12-18
公开(公告)号: CN112580361A 公开(公告)日: 2021-03-30
发明(设计)人: 余海涛;陈明 申请(专利权)人: 蓝舰信息科技南京有限公司
主分类号: G06F40/30 分类号: G06F40/30;G06F40/216;G06F40/284;G06F40/289;G06N20/00
代理公司: 天津垠坤知识产权代理有限公司 12248 代理人: 王忠玮
地址: 211100 江苏省南京市*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供基于统一注意力机制的公式及文字识别模型方法,包括识别prensentation latex或content latex并获得识别结果,对结果进行latex语义树解析,并对语义树进行遍历;使用统计分词方法对latex序列进行分词,使用wordpiece分词方法对于数学公式之外的题干内自然语言进行分词,形成分词序列;对分词序列进行神经网络编码并输出,完成从变长分词序列到定长隐空间表征转化,使用前馈神经网络完成知识点的输出映射,完成对知识点的标注。本发明解决现有互联网教育相关应用中用到的数学学科知识点标注模块的准确性提升,该发明可以通过自然语言处理和数学公式分解的新算法解决现有技术存在公式和文字混排困难理解问题,有效提升标注准确率。
搜索关键词: 基于 统一 注意力 机制 公式 文字 识别 模型 方法
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于蓝舰信息科技南京有限公司,未经蓝舰信息科技南京有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202011505069.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top