[发明专利]一种基于用户反馈修正的智能问答方法及系统在审
申请号: | 202210596842.2 | 申请日: | 2022-05-30 |
公开(公告)号: | CN114997181A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 刘敦楠;胡洋;加鹤萍;王宣元;刘明光;刘江艳 | 申请(专利权)人: | 华北电力大学;国网冀北电力有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/289;G06F16/33;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 天津盛理知识产权代理有限公司 12209 | 代理人: | 王雨晴 |
地址: | 102206*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 反馈 修正 智能 问答 方法 系统 | ||
本发明涉及一种基于用户反馈修正的智能问答方法及系统,包括以下步骤:步骤1、用户输入提问问题,进行文本分词和特征词提取;步骤2、对特征词提取结果和问答库文本进行向量化,并计算文本的余弦相似度,生成初步匹配结果;步骤3、将用户输入文本向量和用户反馈数据库向量输入深度学习网络模型,进行用户反馈修正过程;步骤4、综合相似度匹配与用户反馈修正模型的结果,向用户输出最终答案文本。本发明能够解决智能问答中问答结果匹配度低的技术问题。
技术领域
本发明属于信息查询技术领域,涉及一种智能问答方法及系统,尤其是一种基于用户反馈修正的智能问答方法及系统。
背景技术
随着问答系统近几十年来不断发展,其逐渐演化出不同的类型,从不同角度可将问答系统划分为不同类别,不同类别的问答系统拥有不同处理问题的方式。现有的问答系统生成答案的方法通常是采用计算语义相似度或者是文本匹配度,从候选答案集中抽取一条合适的文本作为答案,这种做法的优点是回答语句的质量较高且没有语病错误,但缺点是即使再庞大的语料库也无法覆盖所有问题,会使得问答系统的准确率下降。
在智能问答过程中,用户针对问答结果的评价反馈数据在经处理后,能够有效地反映问答系统的优势与存在的不足,而现有的问答系统对用户反馈数据的利用不足,往往只是简单的存储。随着深度学习在自然语言处理领域的崛起,其能够提取深层特征,针对智能问答中用户反馈评价的数据进行语义解析,并再作用于下一次智能问答过程,达到对结果进一步修正和完善的效果,以弥补语料库无法覆盖所有问题的缺陷,并提高问答结果的准确率。
由于智能问答中传统相似度匹配准确率不高,而用户反馈修正不能单独使用,因此,如何提出一种基于用户反馈修正的智能问答方法及系统,提高问答结果的准确率,是本领域技术人员亟待解决的技术难题。
经检索,未发现与本发明相同或相似的已公开的专利文献。
发明内容
本发明的目的在于克服现有技术的不足,提出一种基于用户反馈修正的智能问答方法及系统,能够解决智能问答中问答结果匹配度低的技术问题。
本发明解决其现实问题是采取以下技术方案实现的:
一种基于用户反馈修正的智能问答方法,包括以下步骤:
步骤1、用户输入提问问题,进行文本分词和特征词提取;
步骤2、对特征词提取结果和问答库文本进行向量化,并计算文本的余弦相似度,生成初步匹配结果;
步骤3、将用户输入文本向量和用户反馈数据库向量输入深度学习网络模型,进行用户反馈修正过程;
步骤4、综合相似度匹配与用户反馈修正模型的结果,向用户输出最终答案文本。
而且,所述步骤1的具体步骤包括:
1.1将用户提问文本输入Jieba分词工具,根据文本实际情况进行分词。
1.2将分词结果输入TextRank算法,提取其中与问答相关的关键词、关键短语或关键句,同时过滤中文语气助词和虚词,得到最终的分词结果。
而且,所述步骤2的具体步骤包括:
2.1采用向量空间模型来进行文本向量化过程,使用one-hot编码将分词后的用户输入文本和问答库文本映射成由一组规范化正交矢量构成的向量空间中的一点;
2.2计算向量空间中用户输入文本向量和本体知识数据库文本向量夹角的余弦值;两个向量A、B夹角的余弦值计算公式如下:
余弦值计算结果越接近1,表明夹角越接近0度,两个向量越相似,即代表用户咨询的问题与本体知识数据库中已有的该条回答相似程度越高,并筛选相似度最高的回答作为初步匹配结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学;国网冀北电力有限公司,未经华北电力大学;国网冀北电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210596842.2/2.html,转载请声明来源钻瓜专利网。