[发明专利]中文自然语言问句语义化的知识库自动问答方法有效
申请号: | 201610125710.6 | 申请日: | 2016-03-04 |
公开(公告)号: | CN105701253B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 胡伟;姜成樾;程龚;瞿裕忠 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33 |
代理公司: | 苏州威世朋知识产权代理事务所(普通合伙) 32235 | 代理人: | 杨林洁 |
地址: | 210093*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种中文自然语言问句语义化的知识库自动问答方法,包括以下步骤:对用户输入的事实型问题进行中文自然语言处理,实现分词、词性标注、命名实体识别和扩展,生成语义依存树;使用泛化模板和语义解析技术获得问句中的时间、空间、事实主体、事实客体等组成成分,然后进行语义化处理,提取问句中所有事件相关的组成元素属性及其取值,生成多个“属性—取值”对,其中待回答的元素以疑问词代替,形成复杂事实三元组集合;待回答部分所在三元组联合其他相关事实三元组形成一个带条件约束的知识库查询,到知识库中进行基于相似度计算的查询匹配,从知识库中抽取结果,得到最终答案。本发明实现了对知识库的快速准确的查询应答。 | ||
搜索关键词: | 中文 自然语言 问句 语义 知识库 自动 问答 方法 | ||
【主权项】:
1.一种中文自然语言问句语义化的知识库自动问答方法,其特征在于,包括以下步骤:(1.1)对于输入的一个事实型中文自然语言问题,将问题中的关键词抽取并基于共指实体加以扩展,生成语义依存树;(1.2)基于所述步骤(1.1)得到的语义依存树,使用事先定义的依存树节点模板以及基于统计学习得到的依存树结构正则模板,提取出问句中包含的多种事实元素及其取值,用中间结果模板生成中间结果;所述步骤(1.2)包括以下步骤:(2.1)使用基于所述步骤(1.1)得到的语义依存树,用依存树节点模板进行再次强化匹配,标注出依存树节点具体的词性类别,生成标注信息;(2.2)基于所述步骤(2.1)得到的标注信息,使用依存树结构正则模板进行问句的主干提取,解析问句依存树的节点路径匹配语法树路径得到有效的问句结构,提取最有用的问句主干内容以及关键修饰词;(2.3)基于所述步骤(2.2)得到的问句主干内容,使用中间结果模板生成中间结果,中间结果表示的内容是问句求解的解决方案,是后续生成基于三元组集合的知识库查询的基础;(1.3)基于所述步骤(1.2)依存树中经由依存树节点模板以及依存树结构正则模板提取得到相关的元素取值和中间结果,以时空约束类事实模型将所述元素取值和中间结果语义化生成三元组集合,形成基于相似度计算的知识库查询,从知识库中抽取答案;所述步骤(1.3)包括以下步骤:(3.1)定义时空约束类事实模型的属性为{时间、地点、主体、客体、主体对客体的行为动作},通过所述步骤(2.1)和(2.2)得到的依存树节点与问句主干内容,确定问句事实相关的时间、地点、主体、客体以及行为动作的取值,包括待回答元素在内;(3.2)基于所述步骤(3.1)抽取得到的取值,以主谓宾三元组形式生成各个事实部分,其中待回答元素的三元组中的待回答取值用疑问词代替,每个问句能够表示成一个问句事实三元组集合;(3.3)基于所述步骤(3.2)得到的问句事实三元组集合,整理成一个带约束条件的知识库查询;(3.4)基于所述步骤(3.3)得到的知识库查询,到知识库中进行子图匹配,对知识库中每个描述结构相似的候选三元组集合进行各个元素属性名的精确匹配和元素属性取值的相似度计算,再依据语义化模型定义的事实元素权重加权平均得到每一个事实三元组集合的最终相似度,按相似度高低排序,从中提取出待回答的部分,即为最终答案。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610125710.6/,转载请声明来源钻瓜专利网。