[发明专利]一种基于知识图谱的问答交互方法及系统在审
申请号: | 202210072483.0 | 申请日: | 2022-01-21 |
公开(公告)号: | CN114461814A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 张顺舟;乔宏永;何志峰;程义林 | 申请(专利权)人: | 中国船舶重工集团公司第七0九研究所 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/253;G06F40/289 |
代理公司: | 武汉华之喻知识产权代理有限公司 42267 | 代理人: | 廖盈春;曹葆青 |
地址: | 430074 湖北省武汉市*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 问答 交互 方法 系统 | ||
本发明公开了一种基于知识图谱的问答交互方法及系统,其中,问答交互方法包括:关键词划分步骤,问答交互步骤;本发明通过语音识别算法和图像识别算法将非结构化文本转化为结构化文本,并从中抽取出DF三元组构建知识图谱,从而使得非结构化文本以知识图谱的形式存储下来;本发明通过训练好的神经网络模型在知识图谱中查找并返回与输入问题相对应的RDF三元组,保证了回答的准确性;本发明通过语法分析算法将问题集中每个问题按主语、谓语、宾语、定语、状语和补语进行划分,并和问题对应的答案一起构建训练集,使用训练集对神经网络模型进行训练。
技术领域
本发明属于人工智能领域,更具体地,涉及一种基于知识图谱的问答交互方法及系统。
背景技术
随着整个社会的信息化程度日渐提高,信息收集方式越来越多元化,信息的内容和种类也越来越丰富;信息的种类主要包括结构化文件和非结构化文件,结构化文件可存储在关系型数据库中,而非结构化文件无法存储在关系型数据库中;非结构化文件主要包括音频文件、图片文件和视频文件。
问答形式作为简单友好的交互形式,正逐渐成为人机交互的新趋势。现有的信息查询系统应用问答形式尚不多见,并且主要是基于关系型数据库中存储的结构化数据而回答,通常采用模板匹配技术将复杂问题拆解并匹配。
一些行业的信息查询系统需要对非结构化文件中的有用信息进行查询,但是现有的基于模板匹配技术的信息查询系统无法存储非结构化文件,而且因为问题输入形式有标准模板,若偏离模板提出问题,则会造成无法识别问题或回答准确率严重降低。
为了便于理解本发明,以下对有关术语和相关概念进行解释:
知识图谱:当前管理海量结构化信息和其本体关系的热门应用,描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系;
语音识别算法:常用的用于将人类的语音中的词汇内容转化为计算机可读的输入的算法;常用的语音识别算法包括:动态时间规整算法(DTW),隐马尔可夫模型算法(HMM),基于非参数模型的矢量量化算法(VQ),SVM多类分类算法等;
图像识别算法:常用的对图片或视频中的图像做出各种处理、分析,最终识别出要研究的目标,并将其转变为计算机能够认识的信息的算法;常用的图像识别算法包括:基于CTC的CNN+RNN算法,基于Attention的CNN+RNN算法;
关系抽取算法:常用的用于从自然语言文本中抽取实体及其之间关系的算法;常用的关系抽取算法包括pipeline关系抽取算法;
语法分析算法:常用的用于按照源语言的语法规则,从词法分析的结果中识别出相应的语法范畴,同时进行语法检查的算法;常用的语法分析算法包括Python语言里pyLtp算法库中的语法分析算法;
RDF三元组:实体、关系、属性三元组;本发明中的RDF三元组包括实体,关系和属性列表;
图片文件库:由多个图片文件组成,每个图片文件的格式为预先设定的格式;
视频文件库:由多个视频文件组成,每个视频文件的时长为预先设定的时长;
音频文件库:由多个音频文件组成,每个音频文件的时长在40秒-1小时范围内;
结构化文本:能够用数据或统一的结构加以表示的文本;音频结构化文本、图片结构化文本和视频结构化文本的文本类型均为结构化文本,文本内容均不相同;
神经网络模型:常用的模拟人类大脑处理信息方式的简化模型;本发明中的神经网络模型为4层BP神经网络模型,包括:隐含层一(8节点);隐含层二(3节点);隐含层三(5节点);归一化层(3节点);输入分为6个维度,分别是输入问题的主语、谓语、宾语、定语、状语、补语;输出为3个维度,分别对应RFD三元组中的实体,关系和属性列表;
问题:一个中文句子,可包含标点符号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国船舶重工集团公司第七0九研究所,未经中国船舶重工集团公司第七0九研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210072483.0/2.html,转载请声明来源钻瓜专利网。