[发明专利]基于双向长短期记忆神经网络的智能自动问答方法及系统在审
申请号: | 201811478881.2 | 申请日: | 2018-12-05 |
公开(公告)号: | CN109299478A | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 冯俊龙;刘妍;周超然;张昕;冯欣;赵建平;张剑飞;张婧;孙庚 | 申请(专利权)人: | 长春理工大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/332;G06F16/335;G06N3/08 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 程华 |
地址: | 130000 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 记忆神经网络 自动问答 智能 匹配 用户目标向量 目标向量 用户问题 特征词 相似度 数据库 矩阵 语义 核心特征 获取信息 矩阵输入 问题答案 问题文本 构建 向量 答案 转化 | ||
本发明公开一种基于双向长短期记忆神经网络的智能自动问答方法及系统。该方法包括首先构建双向长短期记忆神经网络模型和智能自动问答数据库;其次将用户输入问题文本进行切词与向量转化处理,得到特征词和用户问题矩阵,并从智能自动问答数据库中提取与特征词相匹配的问题列表,将用户问题矩阵输入到双向长短期记忆神经网络模型得到用户目标向量;最后计算用户目标向量与问题列表中每个目标向量的相似度,并将相似度最高的目标向量对应的问题答案确定为用户所需答案。本发明通过核心特征词匹配以及双向长短期记忆神经网络模型对问题语义的匹配,满足了人们对快速、准确地获取信息的需求。
技术领域
本发明涉及问答系统技术领域,特别是涉及一种基于双向长短期记忆神经网络的智能自动问答方法及系统。
背景技术
问答系统(Question Answering System,QA)是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。其研究兴起的主要原因是人们对快速、准确地获取信息的需求。问答系统是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。
智能问答系统以一问一答形式,精确的定位网站用户所需要的提问知识,通过与网站用户进行交互,为网站用户提供个性化的信息服务。将积累的无序语料信息,进行有序和科学的整理,并建立基于知识的分类模型;这些分类模型可以指导新增加的语料咨询和服务信息,节约人力资源,提高信息处理的自动性,降低网站运行成本。基于对网站多年积累的关于政府和企业的基本情况常见问题及其解答,整理为规范的问答库形式,以支撑各种形式问题的智能问答,方便了用户,提高了办事效率,提升了企业形象。
由于信息是现实世界的反映。客观事物均能够通过不同的形式来体现,比如身份证登记和人事档案即从不同的侧面来反映一个人存在的信息,这些信息包括姓名、性别、民族、籍贯、社会关系、政治面貌等,从各个方面来描述这个人,可以说,客观事物的存在与动态演变情况都是由信息反映的。这一概念引入到问答系统中,表现出同一个问题可以有多种说法,如:新来的同学是男孩还是女孩,新来的同学性别是什么。
基于信息检索是传统问答系统的经典方法。其传统问答系统按照以下的流程工作:
1.问题解析(解析问句、理解语义):
处理问题:处理用户输入的自然语言问题,传统问答系统对于问题进行处理和分析,并对问题进行分类,确定问题类型。
生成搜索关键词:问题中的一些词不适合作为搜索关键词,另一些词的搜索权重则较高。传统问答系统需要对于用户的问题进行分析,来获得不同关键词的权重。
2.信息检索(获取可能包含的网页或答案):
传统问答系统使用从用户的问题中得到的关键词,对于数据库中的文档与关键词的计算匹配程度,从而获取若干个可能包含答案的候选文章,并且根据它们的相似度进行排序。
3.答案抽取(从结果中判断并找到结论返回给用户):
段落提取:段落(paragraph)是包含答案的一个小节。问答系统与搜索引擎的区别在于用户期望其返回精确的答案,而不是一个文章或段落。为此首先要从文章中提取出可能包含答案的段落。
答案提取:在答案可能出现的段落被提取到以后,问答系统需要精确抽取段落中所包含的答案。这一步会用到问题分类。同时根据问题的关键词,对于段落中的词进行语义分析,最终找到最有可能是答案的字段。
在传统的问答系统中,主要是针对问题数据的特征词匹配来进行答案匹配,对问题解析层面的处理相对粗糙,此现象在问题数据上的表现更为不好,通过生成搜索关键词的方式无法完全囊括问题的实际语义,忽略了上下文语义,并无法避免关键词进行相似替换后的答案无法查询的问题。因此,在问题中的实际应用中对问题文本数据进行上下文分析及语义理解是十分必要的。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春理工大学,未经长春理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811478881.2/2.html,转载请声明来源钻瓜专利网。