[发明专利]一种融合知识库与用户建模的智能问答方法及系统有效
申请号: | 202010065407.8 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111414461B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 陈羽中;李超凡;郭昆;张睿 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 丘鸿超;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 知识库 用户 建模 智能 问答 方法 系统 | ||
本发明涉及一种融合知识库与用户建模的智能问答方法及系统,该方法包括以下步骤:步骤A:采集智能问答系统中的问题以及回答记录,构建问答对训练集
技术领域
本发明涉及自然语言处理与情感分析应用领域,具体涉及一种融合知识库与用户建模的智能问答方法及系统。
背景技术
随着社会信息化和互联网的快速发展,人们对于问答系统的需求日益增长。2005年以来,互联网相继涌现了大量的问答社区,基于社区的问答系统逐渐成了问答系统的一个重要研究分支,人们热衷于在社区智能问答系统上提出问题,获取答案并且同他人交流来分享自己的知识。
根据知识来源的不同,问答系统可以分为以下三种任务:基于知识库的问答、基于文档的问答、答案选择。问答系统的工作原理是用户用人类语言的形式提出查询信息的需求,系统通过某种技术手段对问题进行语义分析,接着从多种类的数据源(知识图谱、数据库、文档等)中找出最匹配的答案。传统的解决方法是通过人工构造规则和特征构建符合场景的规则组合来达到计算的目的;现代的自然语言处理领域已经大量运用统计机器学习的算法,通过机器学习算法来计算问题和答案的匹配关系;近两年,深度学习方法深受欢迎,基于词向量技术、循环神经网络、卷积神经网络等理论的研究也层出不穷,且已经被大量用于智能问答系统的各类应用场景中并且取得了突出的性能表现。
Carmel提出了一种改进的单词权重计算模型,加入了词语的词性和依赖关系等语法特性,这些特征被用来训练排序模型,验证了该方法的有效性。Wang等人通过将每一个问题句子都生成其语法树的形式,然后比较问题的语法树的相似性来判断问题的相似性。Jeon等人利用非文本特征来预测答案的质量,系统地分析了一些非文本特征对于预测答案质量的作用,最后应用最大熵方法和核密度方法去预测答案的质量。Liu等人利用大多数CQA问题都有多个答案的特性,把答案抽取的问题转换为多文档摘要的问题,从而达到较好的效果。
深度学习理论在答案抽取和排序任务上也有一定应用。Iyyer等人利用一个依赖树递归神经网络并且结合句子间的预测来对回答进行排列。Wang使用双向长短时记忆网络进行答案选择,将BiLSTM与关键词匹配模型相结合,由BiLSTM输出问题答案间的匹配结果。Guo等人引入一个跳跃卷积神经网络(Skip Convolutional Network)来获取语法语义特征。Zhou等人将答案选择看成答案标注问题,首先使用卷积神经网络(ConvolutionalNeural Network,CNN)抽取问题和答案的分布式表示,然后将联合表示作为循环记忆网络的输入,以学习所有答案与问题的匹配关系。Tan等人引入一个混合神经网络,通过结合卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent NeuralNetwork,RNN)的结果来学习问题/回答的表示。Santos等人提出一个一种双向注意机制,将成对的输入序列投射到一个公共的表示空间中,以更好的排列答案。
传统CQA系统使用有监督学习,训练答案排序和问题检索模型,但该方法需要抽取复杂的文本特征,很难在特征构造上做到最优,并且该方法在新的数据集上泛化性能较差,对新数据集往往需求重新进行特征抽取和特征工程。目前基于深度学习的方法通常基于单一的卷积神经网络或循环神经网络,无法全面准确地提取影响智能问答精度的各项特征,并且没有充分利用知识库中存储的先验知识作为问题回答的背景知识,在社区问答系统中没有考虑到用户自身所携带的信息对于回答选择所起的作用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010065407.8/2.html,转载请声明来源钻瓜专利网。