[发明专利]中文自然语言问句语义化的知识库自动问答方法有效
申请号: | 201610125710.6 | 申请日: | 2016-03-04 |
公开(公告)号: | CN105701253B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 胡伟;姜成樾;程龚;瞿裕忠 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33 |
代理公司: | 苏州威世朋知识产权代理事务所(普通合伙) 32235 | 代理人: | 杨林洁 |
地址: | 210093*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中文 自然语言 问句 语义 知识库 自动 问答 方法 | ||
本发明公开了一种中文自然语言问句语义化的知识库自动问答方法,包括以下步骤:对用户输入的事实型问题进行中文自然语言处理,实现分词、词性标注、命名实体识别和扩展,生成语义依存树;使用泛化模板和语义解析技术获得问句中的时间、空间、事实主体、事实客体等组成成分,然后进行语义化处理,提取问句中所有事件相关的组成元素属性及其取值,生成多个“属性—取值”对,其中待回答的元素以疑问词代替,形成复杂事实三元组集合;待回答部分所在三元组联合其他相关事实三元组形成一个带条件约束的知识库查询,到知识库中进行基于相似度计算的查询匹配,从知识库中抽取结果,得到最终答案。本发明实现了对知识库的快速准确的查询应答。
技术领域
本发明涉及语义网、自然语言处理和自动问答技术,尤其涉及一种中文自然语言问句语义化的知识库自动问答方法,具体是一种基于模板提取的中文自然语言问句语义化的知识库自动问答方法,特别是一种通过将中文自然语言问句进行模板提取的语义化转换成知识库查询来实现面向事实型问题的知识库自动问答方法。
背景技术
语义网(Semantic Web)是万维网的一个重要发展方向,为万维网上的知识表示、推理、交换和复用提供了基础。语义网使用一组“属性—取值”来描述其中的实体(entity),单个“属性—取值”对可以表示为<pi,vi>,其中pi表示某个属性,vi表示pi的某个取值。实体可以描述为一个或多个此种值对的集合。例如万维网发明人Tim Berners-Lee先生,其姓名在语义网数据源DBpedia中被表示为<name,Tim Berners-Lee>。通常,一个语义网实体描述包含数十条乃至上百条这样的“属性—取值”,且一个属性也可以有多个不同取值。随着语义网快速发展,语义网技术在各个不同领域都有了不同程度的研究和应用。
自然语言处理(natural language processing)是研究人与计算机交互的语言问题的一门学科。处理自然语言的关键是要让计算机“理解”自然语言,自然语言处理的关键技术包括自然语句的分词、词性标注、命名实体识别、指代消解、句法依存分析等。
问答技术(question answering),是信息检索技术的一种高级形式,它能用准确、简洁的自然语言回答用户的自然语言问题。自动问答系统能够自动分析问题并给出相应的候选答案,传统的自动问答系统主要由问题分析、信息检索和答案生成等模块构成。
传统的自动问答主要是面向文本集合进行的,包括分析问题中的关键词,将关键词提交到搜索引擎,从文本库中检索相关文档,获取返回结果中确信度最高的前若干文档,再从中生成答案。但是随着语义网技术的发展与逐渐普及,知识图谱(knowledge graph)、链接数据(linked data)等信息组织程度较高的结构化知识库兴起,例如DBpedia和Freebase,使得新式基于结构化知识库实现自动问答成为可能。
相当规模的文档集合在经过语义解析之后,采用结构化的知识表示形式(常见表示为“实体—属性—取值”的三元组结构),形成了包含大量三元组的知识库。在这种知识库的基础上进行自动问答,比传统基于文本的自动问答更为高效、准确。如果用户能够使用查询对知识库进行提问,无疑能够精准快速地获得答案。但是在实际运用自动问答技术时,大部分用户并不能够实现这种“专业”的提问方式,而往往只会使用人类自然语言的形式进行提问,因此基于自然语言问句的知识库问答具有重要价值。在基于知识库的自动问答过程中,用户输入中文自然语言问句后,传统方法对问句仅采取简单处理得到关键词,生成的查询结构化程度不高,不能实现对知识库数据准确高效的查询。
发明内容
本发明面向三元组结构的知识库(下文简称为“知识库”),提出了一种通过将用户输入的中文自然语言问句进行基于模板提取的语义化,将中文自然语言问句转换成结构化查询,实现面向知识库的事实型问题的自动问答方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610125710.6/2.html,转载请声明来源钻瓜专利网。