[发明专利]实现航空领域知识问答的方法和系统在审
申请号: | 202210376477.4 | 申请日: | 2022-04-11 |
公开(公告)号: | CN114757184A | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 董洪飞;高魁;贺薇;陶剑;刘俊;王孝天;武铎;高龙;何柳;安然 | 申请(专利权)人: | 中国航空综合技术研究所 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/35;G06F40/30;G06F16/36;G06F40/242;G06F40/284;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京孚睿湾知识产权代理事务所(普通合伙) 11474 | 代理人: | 韩燕 |
地址: | 100028 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实现 航空 领域 知识 问答 方法 系统 | ||
本发明提供一种实现航空领域知识问答的方法和系统,方法包括以下步骤:S1:对文本中的词语进行分类并设置权重;S2:通过改进的词典权重调整的BM25算法,得到和问题文本最相似的k篇文本段落;S3:使用Bert模型得到对应文本的字符特征向量;S4:通过特征融合获得字符最终特征向量;S5:将字符最终特征向量输入到改进的BiDAF+Bi‑LSTM模型得到带有多种特征的问题文本字符特征向量和文本段落字符特征向量;S6:通过判断答案开始的全连接层+softmax和判断答案结束的全连接层+softmax抽取出对应文本的答案句;S7:若k=1,直接得到答案句;若k≠1,还需执行S8;S8:使用LTP工具生成多文本答案句。系统用于实现方法。本发明解决现有的智能问答系统无法满足航空领域问答的需求。
技术领域
本申请涉及人工智能领域,具体涉及一种实现航空领域知识问答的方法和系统。
背景技术
随着人工智能的快速发展,许多生活工作必备的智能产品都需要具有人工智能问答的功能,提升智能问答的准确性对于用户体验具有十分重要的意义。
智能问答系统是综合运用了自然语言处理、信息检索、语义分析和人工智能等技术的一种新型的信息服务系统。最初的问答系统是由ELIZA和ALICE设计实现的基于模式匹配的问答系统。该问答系统通过匹配用户问题与人工定义问题模板来获取问题答案,或者基于领域专家知识制定启发式规则推理获得相应的结果。但是由于这类系统的模式库和规则的构建非常困难,需要领域专家综合领域知识且受到知识理解的限制,对于新的领域知识往往缺乏相匹配的知识性能很差。目前较多商业化公司采用的智能问答系统是基于FAQ(Frequently Asked Questions)的问答系统,其侧重于将问题及相应的答案对存放在系统的知识库中通过提问相似度设置阈值找寻答案。其采用的技术主要包括CNN(Convolutional Neural Network)、LSTM(Long Short-Term Memory)和Attention机制。CNN主要依赖于空间上的卷积核来考虑序列依赖关系。LSTM引入了门控记忆单元,有效地解决了长期信息保存和短期输入跳跃的问题。而LSTM只能对输入生成固定长度的向量,不会对信息重要程度进行区分。Attention机制的核心逻辑就是从关注全部到关注重点,将有限的注意力集中在重点信息上,从而节省资源,快速获得最有效的信息。这些技术方法使得该问答系统结构框架明了、实现简单、容易理解。但基于FAQ的问答系统的缺点是知识库的构建需要大量的人员参与,比较耗时、系统灵活性较低,问题的覆盖面较低。随着BERT(Bidirectional Encoder Representation from Transformers)预训练模型的出现,语言模型对文本语义的表征提取更加丰富。随之发展出基于无结构化文本的问答技术主要包括社区问答和基于问答式搜索的问答系统。该类系统的缺点是没有专业知识库的支撑,只能对有限类型的问题进行回答,在专业度较高的领域不适用。
由上可知,现有的智能问答系统主要应用于开放领域,而限定领域(政府、医疗等)的数据难以通过互联网直接获取,系统无法很好的理解用户所提出的问题与所对应的领域相关的知识。导致开放领域的智能问答系统难以在这些领域应用,无法返回较好的结果。因此特别需要一套面向专业领域的智能问答实现方法,能够通过用户输入来准确理解用户意图,快速、准确的由用户输入的查询语句匹配出候选答案。
发明内容
为了克服现有技术的缺陷,本发明提供一种实现航空领域知识问答的方法,其包括以下步骤:
S1:根据航空知识领域的文本段落得到问题文本,再对文本段落和问题文本中的词语进行分类并设置优先级和权重,
S2:针对不同优先级的词语,通过改进的词典权重调整的BM25算法,得到和问题文本最相似的k篇文本段落;
S3:将问题文本Q和k篇文本段落中的每一个文本分别使用面向航空领域微调后的Bert模型得到对应文本的字符特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国航空综合技术研究所,未经中国航空综合技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210376477.4/2.html,转载请声明来源钻瓜专利网。