[发明专利]完型填空答题方法、装置、电子设备及存储介质在审
申请号: | 201910528256.2 | 申请日: | 2019-06-18 |
公开(公告)号: | CN110222345A | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 吴良顺 | 申请(专利权)人: | 卓尔智联(武汉)研究院有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/22 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 饶智彬;陈敬华 |
地址: | 430000 湖北省武汉市黄陂区盘龙城经*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 单词 文档数据 题目 词向量 问题数据 填空 存储介质 单词向量 电子设备 问题向量 答题 构建 概率 答案数据 记忆网络 判断结果 归一化 点积 答案 合并 | ||
本发明涉及一种完型填空答题方法、装置、电子设备及存储介质。所述方法包括:构建题目文档数据中的单词的词向量;对所述题目文档数据中的单词的词向量进行双向长短记忆网络编码后生成单词的单词向量;构建问题数据中单词的词向量,并对所述问题数据中的单词的词向量进行编码后生成问题向量;将题目文档数据中的每个单词的单词向量与所述问题数据中的问题向量作点积并归一化得到所述题目文档数据中的每个单词的概率值,并将所述题目文档数据中相同单词的概率进行合并得到所述题目文档数据中所有单词的概率;及根据判断结果及所述答案数据确定最终答案。
技术领域
本发明涉及计算机处理领域,具体涉及一种完型填空答题方法、装置、电子设备及存储介质。
背景技术
完形填空题是我国各地中学英语试题中最为流行的一种题型,也是难度大,得分率低的题型。一般来说,完形填空阅读理解是一种文档与查询之间挖掘关系的代表性问题,完形填空题的干扰项的设置主要与文意相关。现有的自动完形填空系统是基于n元模型构建的朴素系统,主要依据词组在文档中出现的频次来判断,只能回答文档中已经出现过的单词组合,但缺乏推理能力,对于文中没有出现的固定搭配,则无法给出答案。
发明内容
鉴于以上内容,有必要提出一种完型填空答题方法、装置、电子设备及计算机可读存储介质,以解决完型填空问题与完型填空答案的组合在文中没有出现固定搭配的情况下无法自动给出答案的问题。
本申请的第一方面提供一种完型填空答题方法,其特征在于,所述方法包括:
获取答题数据,其中,所述答题数据包括题目文档数据、问题数据及答案数据;
构建所述题目文档数据中的单词的词向量;
对所述题目文档数据中的单词的词向量进行双向长短记忆网络编码后生成所述题目文档数据中的单词的单词向量;
构建所述问题数据中单词的词向量,并对所述问题数据中的单词的词向量进行双向长短记忆网络编码并将经过编码的词向量通过所述双向长短记忆网络的输出层输出后生成问题向量;
将所述题目文档数据中的每个单词的单词向量与所述问题数据中的问题向量作点积并归一化得到所述题目文档数据中的每个单词的概率值,并将所述题目文档数据中相同单词的概率进行合并得到所述题目文档数据中所有单词的概率;
判断所述题目文档数据中概率最大的单词与答案数据中的单词是否相同;及
根据判断结果及所述答案数据确定最终答案。
优选的,所述根据判断结果及所述答案数据确定最终答案包括:
当所述题目文档数据中概率最大的单词与所述答案数据中的单词向量相同时,将在所述答案数据中与概率最大的单词相同的单词确认为最终答案。
当所述题目文档数据中概率最大的单词与答案数据中的单词向量相同时,将在所述答案数据中与概率最大的单词相同的单词确认为最终答案。
优选的,所述构建所述题目文档数据中的单词的词向量包括:
对所述答题数据中的每个单词分别进行独热编码生成单词的编码向量;
构建所述答题数据中所有单词的词嵌入矩阵;及
将所述题目文档数据中的单词的编码向量与所述词嵌入矩阵进行乘积运算并降维后得到所述题目文档数据中单词的词向量。
优选的,所述对所述答题数据中的每个单词分别进行独热编码生成单词的编码向量包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卓尔智联(武汉)研究院有限公司,未经卓尔智联(武汉)研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910528256.2/2.html,转载请声明来源钻瓜专利网。