[发明专利]一种自动生成英语阅读理解问答的方法在审
申请号: | 202310513812.5 | 申请日: | 2023-05-09 |
公开(公告)号: | CN116579323A | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 戴翰波;刘思琪 | 申请(专利权)人: | 武汉慧人信息科技有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06N3/0455;G06N3/047;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430073 湖北省武汉市东湖新技术*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 生成 英语 阅读 理解 问答 方法 | ||
本发明公布了一种自动生成英语阅读理解问答的方法,本发明的方法是基于transformer模型实现,包括将阅读理解文章中的文本进行数据预处理生成训练集,将训练集输入到模型进行编码为句子向量和难度向量,利用句子向量和难度向量在解码器进行解码生成难度等级递增的问题和答案。主要实现的核心技术是利用难度向量和句子向量在解码器中解码生成难度递增的问题和答案,实现了针对英语阅读理解里面的文章进行解析,并自动生成难度递增问题和答案的用途。依次输出难度等级递增的问题给学生进行训练,有效解决了学生无法评估自身在英语阅读理解上的学习能力以及提高了学生的阅读能力和学习能力。
技术领域
本发明涉及自然语言处理领域,尤其涉及一种自动生成英语阅读理解问答的方法。
背景技术
目前生成问答的方法有很多,例如利用基于规则的问答系统,该方法利用预定义的规则来匹配问题和答案;基于模板的问答系统,这种方法利用预定义的模板来匹配问题和答案;基于检索的问答系统,利用检索引擎获取相关文本,然后通过自然语言处理技术匹配问题和答案;基于生成的问答系统,通过利用深度学习技术来生成问题和答案。针对英语阅读理解的问答生成方法,可实现生成的问答难度呈递增式分布。
发明内容
本发明提出了一种自动生成英语阅读理解问答的方法,利用句子向量和难度向量生成难度递增的问题和答案,使得生成的问答有相关性的关联。
本发明的技术方案是:一种自动生成英语阅读理解问答的方法,所述方法的具体步骤如下:
第一步:使用多头注意力机制,将输入的句子向量和难度向量分别作为查询向量和键向量进行计算,得到每个查询向量和键向量之间的注意力权重向量,然后,将得到的注意力权重向量进行加权平均计算出最终的注意力权重向量。最后,将最终的注意力权重向量与对应的值向量进行加权求和得到加权的句子向量,同时初始化难度向量的权重,将加权后的句子向量和带权的难度向量输入到各个解码器层中;
第二步:在每个解码器层中,使用自注意力机制,对加权的句子向量和带权的难度向量进行加权平均得到加权的上下文向量;
第三步:在每个解码器层中,将加权的上下文向量与上一个解码器层的加权输出进行拼接,输入到前馈神经网络中生成一个上下文感知的加权向量,将带权的难度向量与上一个解码器层的加权输出进行拼接,输入到前馈神经网络中生成一个难度感知的加权向量,将上下文感知的加权向量和难度感知的加权向量进行加权平均得到一个加权的解码器输出,将难度向量的权重和加权的解码器输出相乘得到当前解码器层的加权输出,得到的解码器层的加权输出作为下一个解码器层的输入;
第四步:将多个解码器层的加权输出拼接起来,通过激活函数转换为概率分布,利用难度向量的权重选取概率较高的单词,拼接输出的单词作为生成难度相符的问题和答案;
第五步:增加难度向量的权重同时减少句子向量的权重,再将权重变化后的带权难度向量和加权句子向量输入到解码器中再次解码生成比上一级难度更高的问题与答案。通过逐步调整难度向量和句子向量的权重,使难度向量对加权句子向量的影响逐渐增加,利用解码器解码生成难度递增的问题和答案。
本发明的有益效果是:
本发明给出的利用难度向量和句子向量自动生成难度递增的问题和答案的技术方法,关联了生成问答系列的相关性,对于在英语阅读理解实际应用中,学生可以准确了解自身的学习水平以及降低了教师对于学生在英语阅读理解上个性化教学的难度。
附图说明
图1是一种自动生成英语阅读理解问答的方法的流程图;
图2是通过解码器解码生成难度递增的问题和答案的流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉慧人信息科技有限公司,未经武汉慧人信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310513812.5/2.html,转载请声明来源钻瓜专利网。