[发明专利]一种基于本体推理的知识问答系统及其工作方法在审
申请号: | 201611047400.3 | 申请日: | 2016-11-22 |
公开(公告)号: | CN106776797A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 陈刚;郝文宁;淦文燕;靳大尉;刘斌;赵水宁;程恺;韩超;张珂;陈敏杰;陈彦君;王军;徐震;张可新;戴晖;王玮 | 申请(专利权)人: | 中国人名解放军理工大学;北京华如科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙)11350 | 代理人: | 汤东凤 |
地址: | 210007 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 本体 推理 知识 问答 系统 及其 工作 方法 | ||
1.一种基于本体推理的知识问答系统,其特征在于:包括语料库管理单元、知识管理单元、知识推理单元、综合知识库单元、知识问答交互单元;所述语料库管理单元、知识管理单元相互连接并分别与知识推理单元相连接,所述知识推理单元与综合知识库单元相连接,所述综合知识库单元与知识问答交互单元相连接;所述语料库管理单元采集语料并储存形成语料库;所述知识管理单元分为本体库管理单元、术语库管理单元、推理规则库管理单元,其中的本体库管理单元面向行业领域知识,以本体类、实例、专业词库的形式进行组织管理,术语库管理单元在构建的本体类、实例、同义词和属性同时建立各自的名词术语;推理规则库管理单元记录本体类、实例、同义词和属性之间的关联关系;所述知识推理单元基于推理规则实现关联问题的挖掘,并将挖掘的结果扩充到综合知识库,综合知识库管理实现问句库、句模库与答案库的管理。
2.根据权利要求1所述的知识问答系统,其特征在于:所述语料库管理单元包括语料数据的采集单元和存储单元,实现知识信息的采集与存储。
3.根据权利要求1所述的知识问答系统,其特征在于:所述采集单元包括数据库采集单元和网络抓取单元。
4.根据权利要求1所述的知识问答系统,其特征在于:所述本体库管理单元包括本体类管理单元、实例管理单元、专业词库管理;本体类管理单元对行业领域知识形成的本体知识概念以本体类的形式管理,以目录树结构展现本体的层次关系;实例管理单元对所属的本体类概念下的具体实例进行管理;专业词库管理是使用文本及图片的形式对专业名词进行定义与解释。
5.根据权利要求1所述的知识问答系统,其特征在于:所述综合知识库单元包括问句库单元、句模库单元与答案库单元,所述问句库单元、句模库单元与答案库单元形成映射关系;问句库单元是指对系统已回答问题的集中记录和分类,句模库单元是针对有效问句的句子躯干(主谓宾)的提取结果集,体现最小语言单元的结果;答案库单元是推理结果进行清洗过滤后的结果集。
6.根据权利要求1所述的知识问答系统,其特征在于:所述知识问答交互单元包括知识提问单元、热点搜索单元、图片搜索单元;知识提问单元是用户输入关注的关键词,系统根据输入提示已有的问句,用户可选择关注的问句,查找想要的问题答案;热点搜索单元根据用户搜索的频度列举重要的搜索名词,用户选择关键字后查找名词的详细说明,并关联该名词相关的其它名词;图片搜索单元是根据用户的搜索频度显示关注度较高的名词图片信息,用户选择图片后,可查找图片对应的名词详细说明,并关联该名词相关的其它名词。
7.一种基于权利要求1-6中任一种知识问答系统的工作方法,其特征在于:该知识问答系统工作方法的步骤是:
S1、系统构建:通过网络爬虫采集和关系型数据库数据采集,形成语料库,通过手动或者自动构建了本体库,并形成了推理规则库和术语库;
S2、用户提问:用户在知识问答交互单元的知识问答界面上输入关键字进行提问;
S3、问答引导:问句库根据用户的输入进行实时提示,给出问句列表,可从列表选择提出的问题,若用户选择了相应的问句,则系统通过映射关系获得答案库内容,反馈结果,流程结束;如用户没有选择相应的问题,则进入下一步;
S4、查询预处理:对用户提出的问题使用本体库中形成的术语库(类、实例、同义词、属性)进行查询预处理,包括基于基础词(采用新华字典库)和本体库中术语的分词,基于停用词库去掉停用词,形成句模;
S5、句模匹配:将句模与句模库进行匹配比对,若已匹配到,则获得匹配句模所关联的答案,展现结果,结束流程;如未匹配到,则进入下一步;
S6、词性划分与标注:将句模与本体库中形成的术语(类、实例、同义词、属性)库进行划分与标注,形成含有标注的句模;
S7、模型算法匹配:通过系统提供的推理模型算法,将含有标注的句模与模型算法匹配,若匹配失败,则提示系统不含有此类知识,提示用户重新查询,若匹配成功,则进入下一步;
S8、推理:结合SPARQL和推理机加载模型算法,在本体库中进行推理和挖掘;
S9、生成知识:对推理结果进行清洗和整理得到答案,并将所使用到的问句,句模和答案形成映射关系并保存到综合知识库;
S10、结果展现:展现问题和得到的答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人名解放军理工大学;北京华如科技股份有限公司,未经中国人名解放军理工大学;北京华如科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611047400.3/1.html,转载请声明来源钻瓜专利网。