[发明专利]一种公式化数据的搜索方法及装置有效
申请号: | 201210158383.6 | 申请日: | 2012-05-18 |
公开(公告)号: | CN102693303B | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | 侯秀峰;徐飞;张国晨 | 申请(专利权)人: | 上海极值信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海市锦天城律师事务所31273 | 代理人: | 刘民选 |
地址: | 201209 上海市浦东新区金海路2*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 公式化 数据 搜索 方法 装置 | ||
1.一种公式化数据搜索装置,其特征在于,包括:
至少一用户端,所述用户端包括一公式输入模块,用于输入公式并转换为一文本化编码,所述公式输入模块包括:一输入界面模块,用于提供标准的公式元件;一处理模块,用于接收由所述公式元件所组成的公式并将其转换为一文本化编码,所述文本化编码为Latex语言或MathML语言或OpenMath语言;
一网络,用于将所述文本化编码传送至一服务器;
一服务器,所述服务器包括一搜索模块,该搜索模块至少包括一数据库用于存储与公式对应的文本化编码,所述搜索模块包含一索引,所述索引规则为将公式划分为运算变量和运算符两种结构类别,所述运算变量和运算符组成一表达式,所述公式由所述表达式递归或非递归定义而成,所述非递归是指如果所述公式无法匹配所述表达式的定义规则,则所述公式被不断分解直至形成一符合所述表达式定义规则的最长子结构,如果某一公式需要被整体识别,则将所述公式的结构特征添加为一定义规则;
所述索引的规则为,实现粗粒度的公式中关键词的识别,并结合通过扩展表达式的定义规则,以最细粒度的单元作为索引,将所述粗粒度和最细粒度两者结合,实现精确搜索和模糊搜索的功能,即同时进行粗粒度和最细粒度的方式进行搜索;
所述搜索模块根据所述文本化编码查询所述数据库并将查询结果通过所述网络返回所述用户端。
2.如权利要求1所述的公式化数据搜索装置,其特征在于,所述公式元件包括以下的一种或几种:数学公式符号、物理符号、化学符号、化学结构式、化学反应式、五线谱。
3.如权利要求1所述的公式化数据搜索装置,其特征在于,所述公式元件包括一符号以及至少一个输入光标,所述输入光标用于根据用户需要输入一字母或数字。
4.如权利要求1所述的公式化数据搜索装置,其特征在于,所述搜索模块中还包括一网络 爬虫进程,用于在网络中查找与公式相关的网页或文档。
5.一种公式化数据的搜索方法,其特征在于,包括:
建立一索引,所述索引规则包括将公式划分为运算变量和运算符两种结构类别,所述运算变量和运算符组成一表达式,所述公式由所述表达式递归或非递归定义而成,所述非递归是指如果所述公式无法匹配所述表达式的定义规则,则所述公式被不断分解直至形成一符合所述表达式定义规则的最长子结构,如果某一公式需要被整体识别,则将所述公式的结构特征添加为一定义规则;
所述索引的规则为,实现粗粒度的公式中关键词的识别,并结合通过扩展表达式的定义规则,以最细粒度的单元作为索引,将所述粗粒度和最细粒度两者结合,实现精确搜索和模糊搜索的功能,即同时进行粗粒度和最细粒度的方式进行搜索;
输入一公式,提供一标准的公式元件,用户根据需要选择所述公式元件以生成一公式;
将所述公式转换为一文本化语言,所述文本化语言为Latex语言或MathML语言或OpenMath语言;
查询数据库中的公式;
输出一查询结果。
6.如权利要求5所述的公式化数据的搜索方法,其特征在于,所述公式包括但不限于数学公式、物理公式、化学结构式、化学反应式、五线谱。
7.如权利要求5所述的公式化数据的搜索方法,其特征在于,输入一公式的过程具体包括:提供一标准的公式元件,所述公式元件包括符号以及至少一个输入光标,用户根据需要选择所述符号以及在输入光标处输入一字母或数字,以生成一公式。
8.如权利要求5所述的公式化数据的搜索方法,其特征在于,所述查询数据库中的公式具体包括:在输入公式之前对所述数据库中的公式进行索引,将所述输入公式的文本化语言 在索引中进行查询,与所述数据库的公式进行相似性的比较和评分。
9.如权利要求5所述的公式化数据的搜索方法,其特征在于,所述输出一查询结果具体包括:将查询结果进行排序后呈现给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海极值信息技术有限公司,未经上海极值信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210158383.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:网站广告位价值量计算系统及计算方法
- 下一篇:一种实现电子书签的方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置