[发明专利]一种基于本体推理的知识问答系统及其工作方法在审
申请号: | 201611047400.3 | 申请日: | 2016-11-22 |
公开(公告)号: | CN106776797A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 陈刚;郝文宁;淦文燕;靳大尉;刘斌;赵水宁;程恺;韩超;张珂;陈敏杰;陈彦君;王军;徐震;张可新;戴晖;王玮 | 申请(专利权)人: | 中国人名解放军理工大学;北京华如科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙)11350 | 代理人: | 汤东凤 |
地址: | 210007 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 本体 推理 知识 问答 系统 及其 工作 方法 | ||
技术领域
本发明涉及语言信息处理技术领域,具体地说涉及一种基于本体推理的知识问答系统及其工作方法。
背景技术
随着互联网技术的发展,用户所接触的信息海量增长,急需科学有效的利用信息,减少重复信息与垃圾信息,以最快的速度获取满意的答案。简单的知识问答系统以信息检索与查询为主要方式,没有考虑用户问题的关联性和关注点,效率低下。以自然语言为基础为问答系统,使用关联规则的挖掘,以获取问句间的关联关系,使用获取的问句间关联关系计算后,给用户的提供相互关联的答案,代表了目前知识问答系统的发展方向。
当前,互联网上已出现了一些典型的知识库,如基于维基科半结构化内容构建的Dbpedia、基于众包技术构建的FreeBase及通过权威手工编辑的Cyc知识库等,这些知识库都可能通过统一的SPARQL接口进行查询。然而,随着知识量的增加,用户查询时记不住复杂的URI(Uniform Resource Identifier,统一资源描述符)以及本体Schema(公理系统),经常由于输入了错误的语法,导致查询不到任何结果。因此,需要考虑为用户提供更为简洁高效的交互方式,使用户直接通过自然语言来查询,这也是知识问答系统的所需解决的关键问题。
发明内容
本发明的目的在于针对上述现有技术的缺陷,提供一种集知识采集、知识管理、知识推理、知识问答于一体的基于本体推理的知识问答系统及工作方法。应用本体推理技术,构建了知识存储与组织标准化方法,在保证系统的简单实用的同时,提升系统正确率。
为实现上述目的,本发明所采取的技术方案是:
一种基于本体推理的知识问答系统,包括语料库管理单元、知识管理单元、知识推理单元、综合知识库单元、知识问答交互单元;所述语料库管理单元、知识管理单元相互连接并分别与知识推理单元相连接,所述知识推理单元与综合知识库单元相连接,所述综合知识库单元与知识问答交互单元相连接;所述语料库管理单元采集语料并储存形成语料库;所述知识管理单元分为本体库管理单元、术语库管理单元、推理规则库管理单元,其中的本体库管理单元面向行业领域知识,以本体类、实例、专业词库的形式进行组织管理,术语库管理单元在构建的本体类、实例、同义词和属性同时建立各自的名词术语;推理规则库管理单元记录本体类、实例、同义词和属性之间的关联关系;所述知识推理单元基于推理规则实现关联问题的挖掘,并将挖掘的结果扩充到综合知识库,综合知识库管理实现问句库、句模库与答案库的管理。
作为对上述技术方案的改进,所述语料库管理单元包括语料数据的采集单元和存储单元,实现知识信息的采集与存储。
作为对上述技术方案的改进,所述采集单元包括数据库采集单元和网络抓取单元。
作为对上述技术方案的改进,所述本体库管理单元包括本体类管理单元、实例管理单元、专业词库管理;本体类管理单元对行业领域知识形成的本体知识概念以本体类的形式管理,以目录树结构展现本体的层次关系;实例管理单元对所属的本体类概念下的具体实例进行管理;专业词库管理是使用文本及图片的形式对专业名词进行定义与解释。
作为对上述技术方案的改进,所述综合知识库单元包括问句库单元、句模库单元与答案库单元,所述问句库单元、句模库单元与答案库单元形成映射关系;问句库单元是指对系统已回答问题的集中记录和分类,句模库单元是针对有效问句的句子躯干(主谓宾)的提取结果集,体现最小语言单元的结果;答案库单元是推理结果进行清洗过滤后的结果集。
作为对上述技术方案的改进,所述知识问答交互单元包括知识提问单元、热点搜索单元、图片搜索单元、知识图谱单元;知识提问单元是用户输入关注的关键词,系统根据输入提示已有的问句,用户可选择关注的问句,查找想要的问题答案;热点搜索单元根据用户搜索的频度列举重要的搜索名词,用户选择关键字后查找名词的详细说明,并关联该名词相关的其它名词;图片搜索单元是根据用户的搜索频度显示关注度较高的名词图片信息,用户选择图片后,可查找图片对应的名词详细说明,并关联该名词相关的其它名词。
本发明并提供了上述基于本体推理的知识问答系统的工作方法,该工作方法的步骤是:
S1、系统构建:通过网络爬虫采集和关系型数据库数据采集,形成语料库,通过手动或者自动构建了本体库,并形成了推理规则库和术语库;
S2、用户提问:用户在知识问答交互单元的知识问答界面上输入关键字进行提问;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人名解放军理工大学;北京华如科技股份有限公司,未经中国人名解放军理工大学;北京华如科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611047400.3/2.html,转载请声明来源钻瓜专利网。