[发明专利]启发式精准知识数据搜索引擎及数据自学习自诊断方法有效
申请号: | 201811510921.7 | 申请日: | 2018-12-11 |
公开(公告)号: | CN109684376B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 孙炜 | 申请(专利权)人: | 孙炜 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/36;G06N5/02 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 冯子玲 |
地址: | 100048 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 启发式 精准 知识 数据 搜索引擎 自学习 诊断 方法 | ||
本发明公开了启发式精准知识数据搜索引擎,包括数据提取、核心数据库、关键字和问题转换、逻辑推理器、逻辑表达式转换器和数据标准化,本发明的搜索引擎通过在搜索过程中检查数据和搜索过程的逻辑错误,启发搜索起点提供更多正确的关键词或引导搜索起点回答逻辑关系问题,逐步逼近一个或几个最终搜索结果,该方法可以解决背景技术中,搜索结果精准性问题和搜索结果范围过大的问题,将搜索的到的链接数据转化为逻辑表达式,通过逻辑表达式求解判断链接数据是否为准确搜索结果,以此来进一步解决背景技术中的精准搜索问题。
技术领域:
本发明属于计算机技术领域,特别涉及启发式精准知识数据搜索引擎及数据自学习自诊断方法。
背景技术:
现存的搜索技术中,一类是给定一组关键字,然后以数据和关键字之间的关联度、数据重要性、结果排序、关键字间或数据间的规则(例如满足一定正则表达式)等指标一次性获得搜索结果。提交给搜索起点的是以某种方式排序的搜索结果。此类常见于、数据库、网页、或知识库的搜索引擎中,不支持交互式启发式搜索,并且搜索结果会很多;一类是以机器学习和深度学习为技术手段,从训练数据中总结学习判断模型,然后以该模型做搜索引擎核心。此类常见于知识库和知识图谱的搜索解决方案,通常现在技术手段还不能提供精准搜索结果;另一类是针对知识图谱或语义网按照关联路径推断,其中路径分支可以要求搜索起点做判断,直到搜索结果。此类亦常见于知识图谱或语义网的搜索技术中,要求图谱或语义网有相当高的正确性、准确性、完备性。然而,知识数据通常是通过计算机自动整理得到,其中错误难免,造成对搜索起点启发提问和搜索结果往往是错误的,因而此类方法无法发现错误,无法反复在搜索中做到自学习自诊断数据。
现存的数据搜索和知识搜索无法积累正确的链接数据包含数据间的关系,对搜索过程和数据知识中的错误无法修补,同时缺少启发互动式地与搜索起点沟通。本发明旨在解决这些问题,提供可靠的可信赖的积累知识数据和搜索结果。
发明内容:
本发明解决了上述问题而提供启发式精准知识数据搜索引擎及数据自学习自诊断方法,解决了现有的技术和方法所存在的缺点。
为了解决上述问题,本发明提供了一种技术方案:
启发式精准知识数据搜索引擎,包括数据提取、核心数据库、关键字和问题转换、逻辑推理器、逻辑表达式转换器和数据标准化。
作为优选,所述数据提取是从核心数据中检索提取和所有初始关键字及其逻辑关系相关的数据及其关系。
作为优选,所述核心数据库的表现形式是任意组织存储形式,所述核心数据库生成积累方式包括在线积累和离线积累,所述在线积累为在搜索引擎在线服务过程中,通过验证认证的新数据可以被加入核心数据库,所述离线积累为独立于搜索引擎,不需要在搜索引擎服务过程中,核心数据在后台依旧按照离线积累的过程被积累修正,所述离线积累由依次为高质量文本、数据挖掘工具、核心数据、数据提取、逻辑表达式转换器、逻辑验证、有逻辑问题存在和结束组成,所述核心数据连接有常识数据和数据修复修补,所述数据修复修补与专家知识连接。
作为优选,所述关键字和问题转换的转换过程和逻辑表达式转换器的转换过程互为逆过程,即从逻辑表达式依照标准对照词库向核心数据中的标准词语转换,同时,将词语间的逻辑关系从逻辑关系符号向自然语言转换。
作为优选,所述逻辑推理器在于发现从逻辑表达式转换器得到的一系列逻辑表达式本身和表达式间是否有逻辑冲突、缺失和冗余错误。
作为优选,所述逻辑表达式转换器是逻辑表达式转换的基本功能是从提取到的链接数据和关系转换到逻辑推理器和逻辑验证能接受的逻辑表达式。
作为优选,所述数据标准化是能否进行数理逻辑推理和验证的重要部件,所述数据标准化能够提供词汇数据转换,保证所述逻辑表达式转换器能够形成逻辑范式进行后续逻辑推理和验证。
启发式精准知识数据搜索引擎的数据自学习自诊断方法,所述方法为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于孙炜,未经孙炜许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811510921.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置