[发明专利]一种面向自然语言的城市领域知识模型查询方法和装置在审
申请号: | 202110630148.3 | 申请日: | 2021-06-07 |
公开(公告)号: | CN114297350A | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 赵俊峰;王亚沙;陈俊宇;单中原;杨恺 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/211;G06F40/216;G06F40/247;G06F40/289;G06F40/30;G06K9/62;G06N3/02 |
代理公司: | 北京天悦专利代理事务所(普通合伙) 11311 | 代理人: | 田明;杨方 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 自然语言 城市 领域 知识 模型 查询 方法 装置 | ||
本发明公开了一种面向自然语言的城市领域知识模型查询方法和装置,方法包括:S100、基于城市领域知识模型,对用户输入的自然语言问题进行解析,解析之后,经过与用户迭代式交互,构建自然语言问题的词素集合;S200、基于词素集合和智慧城市领域知识模型,通过隐马模型查询图生成和隐马模型查询图排序,或者通过迭代式查询图生成和迭代式查询图排序,得到最符合自然语言问题的查询子图;S300、将查询子图与预设的模板进行筛选匹配,得到自然语言问题的答案,预设的模板为基于自然语言问题的各类型预设的查询模板。本发明利用隐马模型查询和迭代式查询推测用户问句的领域知识模型查询子图,并查询答案反馈给用户,提高了检索的准确性和检索的效率。
技术领域
本发明涉及知识图谱查询领域,具体涉及一种面向自然语言的城市领域知识模型查询方法和装置。
背景技术
支持用户意图发现的面向自然语言的城市领域知识模型查询,旨在通过解析用户问句,发现用户的提问意图,并将用户问句中的词语匹配到城市领域知识模型,生成查询子图检索出问句答案。然而构建面向自然语言的城市领域知识模型查询系统仍然面临两个挑战,一是面向自然语言的城市领域知识模型查询系统准确性问题,首先需要正确地解析用户问句。当用户输入问句出现二义性,即同一个用户输入问句存在多种合理的解析时,前期的解析错误会导致后期的查询错误。其次是问答准确性问题,在正确地解析了用户输入问句后,如何将解析后的问句映射到城市领域知识模型,进而准确地查询出答案面临很大的挑战。二是面向自然语言的城市领域知识模型查询系统的性能问题,问答系统对响应时间有较高的要求,一般要求小于2s,如何高效地查询答案同样面临很大的挑战。
针对上述挑战,目前已有三类相关的研究工作,但每一类工作仍然有不足之处。第一类工作是基于模板的领域知识模型问答方法,这类工作利用预先定义的模板匹配问句进而得到形式化的查询语言,如Tunstall-Pedoe,Abujabal等的研究工作。这类工作过度依赖于问句模板的设计,而面向自然语言的城市领域知识模型查询中问句种类较多、问题类型较多,无法设计完备的问句模板。第二类工作是基于语义解析的领域知识模型问答方法,这类工作通过对自然语言问题进行解析,将其转化为逻辑形式上的查询语句,并在领域知识模型上执行查询答案,如Yih等的研究工作。这类工作对以英文为主的领域知识模型问答较为有效,在中文场景中,当用户输入问句存在二义性时不能保证其解析的准确性,前期的解析错误会导致后期的答案查询错误。第三类是端到端的领域知识模型问答方法,此类方法无需构建查询,从答案直接入手,设计端到端的神经网络模型对候选答案进行排序,如Bordes等的研究工作。这类工作过度依赖于问答对数据训练有监督的问答模型,面向自然语言的城市领域知识模型查询初期存在冷启动问题,在数据量较少的场景下此类方法效果不佳。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种面向自然语言的城市领域知识模型查询方法和装置,实现智慧城市领域知识的快速、精准检索。
为实现上述目的,本发明采用的技术方案如下:
一种面向自然语言的城市领域知识模型查询方法,包括:
S100、基于城市领域知识模型,对用户输入的自然语言问题进行解析,解析之后,经过与用户迭代式交互,构建所述自然语言问题的词素集合,解析过程包括用户查询主体识别、N-gram算法产生备选词素和词素扩展;
S200、基于所述词素集合和所述智慧城市领域知识模型,通过隐马模型查询图生成和隐马模型查询图排序,或者通过迭代式查询图生成和迭代式查询图排序,得到最符合所述自然语言问题的查询子图;
S300、将所述查询子图与预设的模板进行筛选匹配,得到所述自然语言问题的答案,所述预设的模板为基于所述自然语言问题的各类型预设的查询模板。
进一步,如上所述的方法,S100包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110630148.3/2.html,转载请声明来源钻瓜专利网。