[发明专利]一种公式化数据的搜索方法及装置有效

专利信息
申请号: 201210158383.6 申请日: 2012-05-18
公开(公告)号: CN102693303B 公开(公告)日: 2017-06-06
发明(设计)人: 侯秀峰;徐飞;张国晨 申请(专利权)人: 上海极值信息技术有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海市锦天城律师事务所31273 代理人: 刘民选
地址: 201209 上海市浦东新区金海路2*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 公式化 数据 搜索 方法 装置
【权利要求书】:

1.一种公式化数据搜索装置,其特征在于,包括:

至少一用户端,所述用户端包括一公式输入模块,用于输入公式并转换为一文本化编码,所述公式输入模块包括:一输入界面模块,用于提供标准的公式元件;一处理模块,用于接收由所述公式元件所组成的公式并将其转换为一文本化编码,所述文本化编码为Latex语言或MathML语言或OpenMath语言;

一网络,用于将所述文本化编码传送至一服务器;

一服务器,所述服务器包括一搜索模块,该搜索模块至少包括一数据库用于存储与公式对应的文本化编码,所述搜索模块包含一索引,所述索引规则为将公式划分为运算变量和运算符两种结构类别,所述运算变量和运算符组成一表达式,所述公式由所述表达式递归或非递归定义而成,所述非递归是指如果所述公式无法匹配所述表达式的定义规则,则所述公式被不断分解直至形成一符合所述表达式定义规则的最长子结构,如果某一公式需要被整体识别,则将所述公式的结构特征添加为一定义规则;

所述索引的规则为,实现粗粒度的公式中关键词的识别,并结合通过扩展表达式的定义规则,以最细粒度的单元作为索引,将所述粗粒度和最细粒度两者结合,实现精确搜索和模糊搜索的功能,即同时进行粗粒度和最细粒度的方式进行搜索;

所述搜索模块根据所述文本化编码查询所述数据库并将查询结果通过所述网络返回所述用户端。

2.如权利要求1所述的公式化数据搜索装置,其特征在于,所述公式元件包括以下的一种或几种:数学公式符号、物理符号、化学符号、化学结构式、化学反应式、五线谱。

3.如权利要求1所述的公式化数据搜索装置,其特征在于,所述公式元件包括一符号以及至少一个输入光标,所述输入光标用于根据用户需要输入一字母或数字。

4.如权利要求1所述的公式化数据搜索装置,其特征在于,所述搜索模块中还包括一网络 爬虫进程,用于在网络中查找与公式相关的网页或文档。

5.一种公式化数据的搜索方法,其特征在于,包括:

建立一索引,所述索引规则包括将公式划分为运算变量和运算符两种结构类别,所述运算变量和运算符组成一表达式,所述公式由所述表达式递归或非递归定义而成,所述非递归是指如果所述公式无法匹配所述表达式的定义规则,则所述公式被不断分解直至形成一符合所述表达式定义规则的最长子结构,如果某一公式需要被整体识别,则将所述公式的结构特征添加为一定义规则;

所述索引的规则为,实现粗粒度的公式中关键词的识别,并结合通过扩展表达式的定义规则,以最细粒度的单元作为索引,将所述粗粒度和最细粒度两者结合,实现精确搜索和模糊搜索的功能,即同时进行粗粒度和最细粒度的方式进行搜索;

输入一公式,提供一标准的公式元件,用户根据需要选择所述公式元件以生成一公式;

将所述公式转换为一文本化语言,所述文本化语言为Latex语言或MathML语言或OpenMath语言;

查询数据库中的公式;

输出一查询结果。

6.如权利要求5所述的公式化数据的搜索方法,其特征在于,所述公式包括但不限于数学公式、物理公式、化学结构式、化学反应式、五线谱。

7.如权利要求5所述的公式化数据的搜索方法,其特征在于,输入一公式的过程具体包括:提供一标准的公式元件,所述公式元件包括符号以及至少一个输入光标,用户根据需要选择所述符号以及在输入光标处输入一字母或数字,以生成一公式。

8.如权利要求5所述的公式化数据的搜索方法,其特征在于,所述查询数据库中的公式具体包括:在输入公式之前对所述数据库中的公式进行索引,将所述输入公式的文本化语言 在索引中进行查询,与所述数据库的公式进行相似性的比较和评分。

9.如权利要求5所述的公式化数据的搜索方法,其特征在于,所述输出一查询结果具体包括:将查询结果进行排序后呈现给用户。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海极值信息技术有限公司,未经上海极值信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210158383.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top