[发明专利]一种基于LSTM的获取食品安全问题答案的方法及系统在审

专利信息
申请号: 201911113762.1 申请日: 2019-11-14
公开(公告)号: CN111125295A 公开(公告)日: 2020-05-08
发明(设计)人: 陈瑛;赵筱钰;陈昂轩;董玉博;侯文俊 申请(专利权)人: 中国农业大学
主分类号: G06F16/31 分类号: G06F16/31;G06F16/332;G06F40/289;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 张秀程
地址: 100193 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 lstm 获取 食品安全问题 答案 方法 系统
【说明书】:

发明实施例提供一种基于LSTM的获取食品安全问题答案的方法及系统。该方法包括:获取待回答问题;将所述待回答问题输入至预先训练好的问答判断模型,获取所述问答判断模型输出的问题匹配结果;其中所述问答判断模型是基于食品安全问题答案样本集,使用人工标注的问题答案对及对应的匹配标签训练LSTM模型得到的。本发明实施例通过基于LSTM模型对食品安全问题进行训练,并解决搜索引擎对食品安全事件检索准确性低的问题,能有效从新闻库中筛选出食品安全问题答案。

技术领域

本发明涉及自然语言处理技术领域,尤其涉及一种基于LSTM的获取食品安全问题答案的方法及系统。

背景技术

近年来,由于各类食品安全事件频频发生,使得食品安全问题愈发严峻,加剧了大众对食品安全的担忧。由于信息不对称问题,对于食品安全类信息的数据常难以获取。

目前针对食品安全事件语料主要来源于新闻报道。但是,由于新闻文本长短不一,加之答案分布的不确定性,对于一个食品安全相关问题,在食品安全事件新闻报道中人工寻找答案效率较低。

而大多数自动问答系统以结构化方法构造食品安全数据库,从中挑选出符合问题的对应数据作为返回给消费者的答案。这种数据库构造方法非常依赖人工标注对应数据的质量,一旦数据标注有误差或者没有标注对应问题方面的答案数据,就不能给消费者合理的信息反馈。所以构造一个能够从新闻报道中找到消费者询问问题答案的食品安全问答系统显得很有必要,且这种问答系统能够做到自己生产答案,而不是从已有的数据库中找到答案。

因此,需要提出一种能获取食品安全自动问答答案的方法,能提供相关食品安全事件的查询,给出包含答案的相关语句,保证消费者能够便捷的了解食品安全事件。

发明内容

本发明实施例提供一种基于LSTM的获取食品安全问题答案的方法及系统,用以解决现有技术中依靠人工搜索食品安全问题的答案效率低的问题。

第一方面,本发明实施例提供一种基于LSTM的获取食品安全问题答案的方法,包括:

获取待回答问题;

将所述待回答问题输入至预先训练好的问答判断模型,获取所述问答判断模型输出的问题匹配结果;其中所述问答判断模型是基于食品安全问题答案样本集,使用人工标注的问题答案对及对应的匹配标签训练LSTM模型得到的。

优选地,所述问答判断模型,通过以下步骤获得:

获取食品安全问题答案样本集;

按照问题答案对进行分类,将所述问题答案对中包含目标答案所在的句子定义为第一标签,将所述问题答案对中不包含目标答案的句子定义为第二标签;

基于所述第一标签和所述第二标签,将所述食品安全问题样本集划分为训练集、交叉验证集和测试集;

获取LSTM模型网络结构作为初始模型;

将所述训练集、所述交叉验证集和所述测试集输入至所述初始模型进行训练,得到所述问答判断模型。

优选地,所述获取食品安全问题答案样本集,具体包括:

获取食品安全原始文档;

基于预设食品安全事件进行人工提问,在所述食品安全原始文档中标注具有与所述人工提问匹配答案的句子,将所述具有与所述人工提问的句子与所述人工提问构成匹配问题答案对;

在所述食品安全原始文档中标注与所述人工提问具有预设非关联度的句子,将所述具有预设非关联度的句子与所述人工提问构成不匹配问题答案对;

对所述匹配问题答案对和所述不匹配问题答案对进行分词,采用Word2Vec模型生成食品安全领域的词向量,将问题答案对中分词后的问题和答案映射到词向量空间生成问题答案对向量表示;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业大学,未经中国农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911113762.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top