[发明专利]一种基于动态规划算法的知识图谱中文问答检索方法有效
申请号: | 201710858347.3 | 申请日: | 2017-09-21 |
公开(公告)号: | CN107679124B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 张日崇;王玥;许程;李建欣 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 规划 算法 知识 图谱 中文 问答 检索 方法 | ||
本发明提供一种基于动态规划算法的知识图谱中文问答检索方法,本发明旨在将原本分成三个子步骤的问答过程统一建模到同一个过程中,融入形式语言中状态机的思想将实体的识别过程与问答检索的过程用同一模型进行建模,实体识别被建模成从系统初始状态0到状态1的转移过程,问答检索过程被建模成从状态1转移到状态2的过程。保证回答精度与广度,又能从宏观上将整个问答过程进行统一化建模。另外,本发明将问答过程中的目标实体的转移过程建模成状态机中的状态转移过程,将中转实体建模为中间状态,将最终答案建模为终止状态。在此基础上,使用动态规划算法对所有状态之间的转移过程在整体上进行决策支持,同时保证系统的运行效率。
技术领域
本发明涉及一种检索方法,尤其涉及一种基于动态规划算法的知识图谱中文问答检索方法。
背景技术
随着互联网的发展和网络信息的不断增长,通过搜索引擎可以从互联网中检索到越来越多的信息,搜索结果呈现出数据海量化,形态多样化,覆盖全面化等特点,一方面提升了用户搜索到结果的可能性,另一方面却使得用户很难快速准确地定位到所需的信息。从海量信息中快速、准确地获得有用的信息,是信息时代人们的迫切需求,这一需求也推动了问答系统成为当前自然语言处理领域的一个研究热点。
问答系统和传统信息检索系统的主要区别于两个方面。一是系统的输入,问答系统的输入不再是传统检索方法下的查询关键词,而是更为自然的日常语言的问句;二是系统的输出,传统检索系统的输出是和查询关键词相关的一系列文档,需要用户自己从文档中查找有用信息,而问答系统有能力直接返回针对用户提问的答案,更好的满足用户快速、准确获取信息的需求。问答系统的高效、准确的特点也让其成为未来搜索引擎发展的方向。
与英文问答系统不同的是,中文问答系统需要处理的中文自然语言的语句分析较为困难和复杂,原因表现在语句方面的句法结构复杂,字词方面的歧义消解复杂,语义表达方面的灵活多样等方面。从早期基于如关键词词频等表层特征进行问句与答案文档的匹配的处理方法,到之后基于句法结构分析与人工制定匹配规则的问答方法,再到近年使用深度学习模型直接进行端到端式训练的方法的研究,都是在向提高问答精度,扩大回答范围等方面不断努力。但从文档中提取出最符合用户需求的语句作为问题答案返回给用户方式终究难以保证答案的简洁性与精准性,并且随着目前大数据时代数据规模的迅速增长,在文档中进行检索的代价越来越大,进而也给数据管理与表示方法的革新提出了需求。诸多面向知识应用的大规模数据的管理与组织工具相继产生,知识图谱就是其中一个代表。知识图谱将互联网中原本散落的、无结构的、缺乏关联的数据向表达体系完整,数据表达方式统一,数据之间关系描述详尽的结构化数据进行转化,这种完善规整的数据管理与组织方式给直接基于用户意图或语义的精准化搜索提供可能。所以作为知识图谱的典型基础应用,基于知识图谱的问答方法吸引了大量国内外研究者的关注。
现有技术中,面向自然语言问句的基于知识图谱问答主要包括两类方法:一类从语言本身特性角度出发,基于句法分析以及人工制定匹配规则的方式进行问答;另一类从语言文本宏观上的统计规律角度出发,通过深度学习方式进行问答的分类匹配或端到端的问答训练。然而,通过对问答系统工程实现的效果进行分析后发现,一方面,这两类方法暂时不能在保证回答精度的同时有效地扩大可回答问题的范围,前者过分依赖语言学专家手工制定规则,后者缺乏对结果的可控性与可解释性,另一方面,目前这两类方法大都将问答过程分成对问句中实体的识别与对问答内容的匹配两步来做,后一步最后得到的答案质量依赖于前一步的准确性,这样就难以对整个问答系统形成完整的质量反馈机制与准确度控制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710858347.3/2.html,转载请声明来源钻瓜专利网。