[发明专利]数据检索方法和数据检索系统在审
申请号: | 201610140848.3 | 申请日: | 2016-03-11 |
公开(公告)号: | CN107180059A | 公开(公告)日: | 2017-09-19 |
发明(设计)人: | 百华睿 | 申请(专利权)人: | 北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京友联知识产权代理事务所(普通合伙)11343 | 代理人: | 尚志峰,汪海屏 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 检索 方法 检索系统 | ||
技术领域
本发明涉及检索技术领域,具体而言,涉及一种数据检索方法和一种数据检索系统。
背景技术
目前,知识服务是出版单位最近一段时间追捧的热点应用,国家的在这方面的大量的资金投入也加快了知识服务在出版单位落地的时间。但是目前国内建设的知识服务系统一般来说仍然是传统的文献级别的知识服务,提供传统的全文检索方式,资源关联方面也只是文献与参考文献之间的关联方式。
而在国外,像爱斯维尔这样大型出版商已经成功转型为知识服务提供商,它们更加注重对知识的标引及建立知识之间的语义关联,来实现语义检索。
对于专业出版社来说,专业优质的知识是其核心资源,也是其与互联网内容的最大区别,建立知识服务是其将核心资源进行应用的一种有效的渠道。而在知识服务中,回答用户的问题即检索是最核心的功能。用专业的知识回答问题是出版单位知识服务的最大优势。但是如果检索的结果并不能准确的从语义上分析并给出准确的答案的话,知识服务的功能就大打折扣了。
因此,如何使得到的检索结果更加准确成为亟待解决的问题。
发明内容
本发明正是基于上述问题,提出了一种新的技术方案,当用户进行检索时,可以使得到的检索结果更加准确,从而提升用户的体验。
有鉴于此,本发明的第一方面提出了一种数据检索方法,包括:将知 识图谱中的知识点信息与知识条目进行关联;接收用户输入的检索信息,对所述检索信息进行解析以得到与所述检索信息对应的第一知识点信息;从所述知识图谱中查询与所述第一知识点信息相关的第二知识点信息;获取与所述第一知识点信息和所述第二知识点信息关联的目标知识条目,并展示所述目标知识条目。
在该技术方案中,首先建立知识图谱中的知识点信息与知识条目的关联,然后用户在输入检索信息时,展示给用户的不仅是与检索信息对应的第一知识点信息关联的知识条目,还是与第二知识点信息关联的知识条目,其中,第二知识点与第一知识点相关,从而使得展示给用户的信息更加全面和准确。
知识点信息是指某个专业领域内的核心知识词汇,其可能包含英文词、释文等属性。知识点信息之间可以建立关联关系,并且关联关系也可以拥有属性。知识点信息及其之间的关联关系构成了描述专业领域的知识图谱。
知识条目是指该专业领域的知识词条类资源,其正文由文字或图片混合组成,其他属性有标题、副标题等。例如百科条目、论文、词典中的词条语料等都可以理解为知识条目。
在上述技术方案中,优选地,所述展示所述目标知识条目的步骤,具体包括:根据所述第一知识点信息和所述第二知识点信息中的每个知识点信息关联的所述目标知识条目的权重值,对所述每个知识点信息关联的所述目标知识条目进行展示。
在该技术方案中,根据与每个知识点信息关联的目标知识条目的权重值对该目标知识条目进行展示,例如,将权重值较高的一个或几个目标知识条目展示给用户,使用户可以直接地看到权重值比较高的目标知识条目,进一步地使得展示给用户的目标知识条目更加准确。
在上述任一技术方案中,优选地,还包括:若检测到所述目标知识条目中的任一知识条目被查看,则对所述任一知识条目的权重值进行更新。
在该技术方案中,若用户点击目标知识条目中的任一知识条目来查看任一知识条目的具体内容,说明用户对该任一知识条目比较关注,则对查 看的任一知识条目的权重值进行更新,用户下次再检索相关的信息时,根据更新后的目标知识条目的权重值对检索结果进行展示,以保证展示给用户的检索结果是用户比较关心的内容,从而保证了检索结果的准确性。
在上述任一技术方案中,优选地,还包括:将所述第一知识点信息和所述第二知识点信息以图形的形式进行展示。
在该技术方案中,通过将第一知识点信息和第二知识点信息以图形的形式进行展示,比较直观地展示第一知识点和第二知识点之间的关联关系。另外,还具有知识图谱的导航功能,以供用户可以根据知识图谱比较直观地查看具体其关注的相关知识点信息。
在上述任一技术方案中,优选地,所述知识图谱是OWL格式的文件,以及使用数据库Neo4j存储所述知识条目、所述知识图谱、和所述知识条目与所述知识点信息的关联关系信息。
在该技术方案中,可以通过软件Protégé建立OWL(Web Ontology Language,网络本体语音)格式的知识图谱,而且由于数据库Neo4j拥有比传统关系型数据库快得多的图遍历检索功能,因此,使用数据库Neo4j存储知识条目、知识图谱、和其关联关系的信息,从而方便检索。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正电子有限公司,未经北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610140848.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置