[发明专利]一种基于索引关系的古文献统一逻辑检索方法有效

专利信息
申请号: 201710574556.5 申请日: 2017-07-14
公开(公告)号: CN107480195B 公开(公告)日: 2020-07-10
发明(设计)人: 邵玉斌;朱小妮;杨美菊;王逍翔;曹云 申请(专利权)人: 昆明理工大学
主分类号: G06F16/31 分类号: G06F16/31;G06F16/332
代理公司: 暂无信息 代理人: 暂无信息
地址: 650093 云*** 国省代码: 云南;53
权利要求书: 查看更多 说明书: 查看更多
摘要: 本发明涉及一种基于索引关系的古文献统一逻辑检索方法,具体说法是文本检索中所输入的文本串提取出所包含的任意逻辑关系进行逻辑组合,属于文献检索技术领域。本发明专利具体包括:构建索引系统;统计固定句长的句子出现的次数;对逻辑关系建立相对应规则;对输入的文本串提取其中所包含的逻辑关系;对其中的规则进行组合;结果显示输出以上六个技术步骤。该方法能够基于逻辑关系的理解满足用户不同的检索需求,极大的提升了用户体验。
搜索关键词: 一种 基于 索引 关系 古文献 统一 逻辑 检索 方法
【主权项】:
一种基于索引关系的古文献统一逻辑检索方法,其特征在于:包括下述步骤:1)构建索引系统:读取文本;建立第一索引表,第一索引表包括文档编号及该文档编号对应的文档名称;建立第二索引表,第二索引表包括所有文档中不同的字符及该字符出现在哪些文档中;建立第三索引表,第三索引表包括每个文档中的所有不同的字符及该字符的位置;把第一索引表、第二索引表、第三索引表写入索引文件中进行保存;2)统计固定句长的句子出现的次数:读取第三索引表;因句号、问号、感叹号表示句末的停顿,通过读取第三索引表,能够得到每个文档中句号、问号、感叹号的索引信息,分别记为A、B、C,其中A、B、C中的对应关系为:A[a1,a2,a3······an]、B[b1,b2,b3······bn]、C[c1,c2,c3······cn],Α:a1<a2<a3<······<an、B:b1<b2<b3<······<bn、C:c1<c2<c3<······<cn且(a1···an)、(b1···bn)、(c1···cn)互不相等,A、B、C分别代表着标点符号句号、问号、感叹号,a1‑an表示句号在第三索引中出现的位置,b1‑bn表示问号在第三索引表中出现的位置,c1‑cn表示感叹号在第三索引表中出现的位置;将已经排好序的A、B、C进行合并,定义D、E集合:首先对A、B进行合并,每个序列都维护一个位置指针,并让两个指针同时在两个列表中后移,分别取两个序列的开头a1与b1进行比较,如果a1<b1,则D[a1,b1],指针分别向后移动一位,取a2与b2进行比较,如果b2<a2,则D[a1,b1,b2],将小的那个数组所对应的指针后移一位即b3与a2进行对比,按照从小到大的顺序进行排序,直到A、B两个序列中的数都取完,再将序列C中的数与序列D中的数,按照上述原则进行再次比较,存入集合E中,这样将A、B、C合并为一个按照大小顺序排列的集合E;集合E[e1,e2,e3······en]其中E:e1<e2<e3<······<en,定义集合F,F为:F[e2‑e1,e3‑e2,e4‑e3,······,en‑e(n‑1)];统计集合F中相同数值出现的次数;3)对逻辑关系建立相对应规则:建立交集,对于字符x及字符y,其中x的区间集合:{x1∈{a1<x1<b1},x2∈{a2<x2<b2},x3∈{a3<x3<b3},······,xn∈{an<xn<bn}}其中y的区间集合:{y1∈{c1<y1<d1},y2∈{c2<y2<d2},y3∈{c3<y3<d3},······,yn∈{cn<yn<dn}}设a2=c2,b2=d2;a3=c3,b3=d3;a5=c5,b5=d5则x∩y={{a2<x<b2},{a3<x<b3},{a5<x<b5}}或者x∩y={{c2<y<d2},{c3<y<d3},{c5<y<d5}};交集的交集:已知建立的交集,z∈{y2‑x2,y3‑x3,y5‑x5}且y2‑x2=y5‑x5=c,其中z表示字符在同一区间的差值的一个集合,x∩y={{a2<x<b2},{a3<x<b3},{a5<x<b5}}∩{z∈{y2‑x2,y5‑x5}},x∈{a<x<b}∩y∈{c<y<d}∩{b‑a=c};差集1:已知建立的交集,则{x1∈{a1<x1<b1},x2∈{a2<x2<b2},x3∈{a3<x3<b3},······,xn∈{an<xn<bn}}‑x∩y={{a2<x2<b2},{a3<x3<b3},{a5<x5<b5}}={x1∈{a1<x1<b1},x4∈{a4<x4<b4},x6∈{a6<x6<b6},······,xn∈{an<xn<bn}};差集2:已知建立的交集,则{y1∈{c1<y1<d1},y2∈{c2<y2<d2},x3∈{c3<y3<d3},······,yn∈{cn<yn<dn}}‑x∩y={{c2<y2<d2},{a3<y3<d3},{c5<y5<d5}}={y1∈{c1<y1<d1},y4∈{c4<y4<d4},y6∈{c6<y6<d6},······,yn∈{cn<yn<dn}};4)对输入的文本串提取其中所包含的逻辑关系:由步骤2)、3)知:x∧y,表示在同一个句子内既有x又有y;表示在同一个句子内有x无y;表示在同一个句子内有y无x;yi‑xi=p,表示在同一个句子内y与x之间的差值为一个常数p;yi‑xi>p,表示在同一个句子内y与x之间的差值大于一个常数p;yi‑xi<p,表示在同一个句子内y与x之间的差值小于一个常数p;bi‑ai=Q,表示一个句子长度等于一个常数Q;bi‑ai>Q,表示一个句子长度大于一个常数Q;bi‑ai<Q,表示一个句子长度小于一个常数Q;5)对其中的规则进行组合:表示在同一句话内既有x又有y而没有z;(yi‑xi)=p∧(bi‑ai)=Q,表示在同一个句子内y与x之间的差值为P,句子长度为Q;(yi‑xi)=p∧(bi‑ai)>Q,表示在同一个句子内,y与x之间的差值为P,句子长度大于Q;(yi‑xi)=p∧(bi‑ai)<Q,表示在同一个句子内,y与x之间的差值为P,句子长度小于Q;(yi‑xi)>p∧(bi‑ai)=Q,表示在同一个句子内,y与x之间的差值大于P,句子长度为Q;(yi‑xi)>p∧(bi‑ai)>Q,表示在同一个句子内,y与x之间的差值大于P,句子长度大于Q;(yi‑xi)>p∧(bi‑ai)<Q,表示在同一个句子内,y与x之间的差值大于P,句子长度小于Q;(yi‑xi)<p∧(bi‑ai)=Q,表示在同一个句子内,y与x之间的差值小于P,句子长度为Q;(yi‑xi)<p∧(bi‑ai)>Q,表示在同一个句子内,y与x之间的差值小于P,句子长度大于Q;(yi‑xi)<p∧(bi‑ai)<Q,表示在同一个句子内,y与x之间的差值小于P,句子长度小于Q;6)结果显示输出:根据步骤4)提取出所具有的逻辑关系,根据步骤5)对逻辑关系进行组合,根据步骤1),在索引表中进行查询,把查询结果进行显示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710574556.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top