[发明专利]基于数学表达式评估语言的相似性测度方法有效

专利信息
申请号: 202110351939.2 申请日: 2021-03-31
公开(公告)号: CN113051370B 公开(公告)日: 2022-10-04
发明(设计)人: 田学东;韩苹 申请(专利权)人: 河北大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/338;G06F16/332
代理公司: 石家庄国域专利商标事务所有限公司 13112 代理人: 胡素梅
地址: 071002 *** 国省代码: 河北;13
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 数学 表达式 评估 语言 相似性 测度 方法
【说明书】:

发明提供了一种基于数学表达式评估语言的相似性测度方法。本发明构造基于数学表达式的区间值犹豫模糊语言属性集合,并找到各属性间的偏好程度关系,确定各属性的权重可能度概率值,计算出结果式与查询式的相似度,最终展示给用户所需要的数学表达式检索结果。本发明从构成数学表达式的元素出发,利用运算符、运算数以及查询关键字,形成一种专门用于表达式查询的区间值犹豫模糊语言集合,能够最大程度地表达公式中的不确定性和模糊性,不仅避免了单个确定值表示某对象所造成的片面性决断问题,而且更为贴近人们对事物的表达和描述方式,使得决策效果更为可信和灵活。本发明受河北省自然科学基金资助(项目批准号:F2019201329)。

技术领域

本发明涉及信息检索技术领域,具体地说是一种基于数学表达式评估语言的相似性测度方法。

背景技术

目前,随着信息检索技术的飞速发展,人们对信息的检索方式也呈现多样化发展,如何高效获取更接近人们需求的信息成为信息检索的一个重要内容。与一般信息检索不同的是,数学表达式检索的对象不仅涉及到众多数学符号,而且也包含了数学表达式中各个符号节点的空间位置关系、运算含义等特性。描述数学表达式的方式有图片、LaTeX、MathML和OpenMath等多种格式,现有的相关方法一般局限于处理具有某些格式的数学表达式的相关内容。到目前为止还没有一个能够处理所有格式的数学表达式的系统,因此,数学表达式的检索仍然面临一定的困难和挑战。

数学表达式检索系统根据检索方式的不同可以分为:基于文本检索技术的数学表达式检索方法和特别针对数学表达式的检索方法。

前者的代表系统为DLMF(Digital Library of Mathematical Functions)Search,该系统是基于传统全文检索技术的数学表达式检索系统,通过定义一系列元数据,对表达式进行线性化处理并构建数学表达式的索引结构,以此对数学表达式进行检索,而且在数学表达式检索排序方面利用tf-idf算法改进了排序效果。除此之外,基于文本检索技术的数学表达式检索系统还有MathDex、LeActiveMath和EgoMath等系统。

此外,李永辉等构建了数学表达式的原型系统FormulaSearch,该系统也是利用了文本检索方法,采用文档的DOM树结构并设计了针对数学表达式特征的Lucene分词器的倒排索引,实现了能够同时进行数学表达式的编辑以及分析检索相融合的功能,但是,该系统还未能实现对一些较为复杂的数学表达式的检索。

基于文本检索技术的数学表达式检索方法虽然在一定程度上能够利用成熟的文本字符串进行数学表达式的检索,但是,其不能够应用于所有类型的文本,所以,会导致一些固有的局限性,因此,国内外的学者开始研究一种特别针对数学表达式检索的方法。

MathWebSearch系统是特别针对数学表达式的检索系统,该系统是无法进行文本检索的数学表达式检索系统,其采用非文本化的查询方式,将用户输入的数据转换成置换树结构形式,根据子式构建了特别针对数学表达式特征的索引结构,给用户提供了数学表达式的检索功能,利用余弦相似度实现了关于数学表达式的相关文档间的检索排序。

Kamali等提出了一种数学表达式结构相似性算法,以实现对数学表达式相关文档的检索排序。为了更好地表示数学表达式的结构和语义,Davila等做了有益的尝试,他们使用三层模型表示公式的语义和结构的信息构建并行索引,利用相似度评分给出数学表达式之间的相似程度,在一定程度上提高了数学表达式的排序效果,但是,并行索引会导致存储空间的大量增加,虽然检索精度有所提升,但会造成检索时间和空间的浪费。Wei等为了避免子式检索造成的开销,提出了一种倒排索引结构和动态的剪枝算法,进一步简化了索引,提高了检索的速度和效率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北大学,未经河北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110351939.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top