[发明专利]一种问题生成方法及装置有效

专利信息
申请号: 202010757542.9 申请日: 2020-07-31
公开(公告)号: CN111737439B 公开(公告)日: 2020-12-11
发明(设计)人: 彭爽;崔恒斌 申请(专利权)人: 支付宝(杭州)信息技术有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06N20/00
代理公司: 北京博思佳知识产权代理有限公司 11415 代理人: 周嗣勇
地址: 310000 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 问题 生成 方法 装置
【说明书】:

一种问题生成方法及装置,该方法包括:将原始问题样本和目标问题样本作为训练样本,对由机器阅读模型和评分函数构成的判别器进行逆强化学习训练;其中,所述目标问题样本,为将所述原始问题样本输入问题生成模型生成的语义相似的问题;将所述评分函数输出的重合度评分作为回报,将所述原始问题样本作为训练样本,对由所述问题生成模型构成的生成器进行强化学习训练,以进一步形成所述生成器和所述判别器之间的,以所述目标问题样本作为与所述原始问题样本对应的对抗样本的对抗训练;对抗训练完成的问题生成模型即可用于语义相似的目标问题的生成。

技术领域

本说明书涉及计算机应用领域,尤其涉及一种问题生成方法及装置。

背景技术

在机器问答领域,可以将问题-答案对作为训练样本,训练出可以进行机器问答的问答系统;为了提高问答系统的鲁棒性,人们通常需要在该问答系统被训练之前,预先对即将使用的训练样本进行数据增强;具体而言,可以通过一定手段,生成与原有的问题语义相似,但表达方式存在不同的其他问题,进而生成新的问题-答案对;例如,原有“地球到月球的距离是-约38万千米”这个问题-答案对,则可以生成与该问题相似的新问题“地球到月球有多远”,并进一步生成新的问题-答案对“地球到月球有多远-约38万千米”。

通过上述过程,可以令作为训练样本的问题-答案对中问题的形式更加丰富多样,从而使得训练出的问答系统能够适应更多种形式的问题,也就提高了该问答系统的鲁棒性。

在相关技术中,可以通过调用一个问题生成模型的方式,完成上述“生成与原有的问题语义相似,但表达方式存在不同的其他问题”的过程;显然,这个问题生成模型需要预先进行充分的训练。

然而,传统实现方式下,上述问题生成模型的训练过程往往无法兼顾效果与成本;例如,利用Rouge-2指标计算函数对生成的问题进行自动评价进行强化学习训练,可能产生误判;而靠专家对训练阶段中生成的问题直接进行标记,进行有监督学习训练,则需要消耗较多的人力资源。

而且,上述问题生成模型的优化、调用场景,往往与问答系统的实际应用场景存在差异,很可能导致的生成的问题不适应于最终应用场景的问题。

发明内容

有鉴于此,本说明书公开了一种问题生成方法及装置。

根据本说明书实施例的第一方面,公开了一种问题生成方法,所述方法包括:

将原始问题样本和目标问题样本作为训练样本,对由机器阅读模型和评分函数构成的判别器进行逆强化学习训练;其中,所述评分函数用于计算所述机器阅读模型输出的对应于所述原始问题样本的答案,与对应于所述目标问题样本的答案之间的重合度评分;所述目标问题样本,为将所述原始问题样本输入问题生成模型生成的语义相似的问题;

将所述评分函数输出的重合度评分作为回报,将所述原始问题样本作为训练样本,对由所述问题生成模型构成的生成器进行强化学习训练,以进一步形成所述生成器和所述判别器之间的,以所述目标问题样本作为与所述原始问题样本对应的对抗样本的对抗训练;

获取原始问题,并将获取到的所述原始问题输入对抗训练完成的所述问题生成模型,以得到与所述原始问题对应的语义相似的目标问题。

根据本说明书实施例的第二方面,公开了另一种问题生成方法,所述方法包括:

将原始问题样本和目标问题样本作为训练样本,对作为判别器的问题匹配模型进行逆强化学习训练;其中,所述问题匹配模型用于计算所述原始问题样本和所述目标问题样本的匹配度评分;所述目标问题样本,为将所述原始问题样本输入问题生成模型生成的语义相似的问题;

将所述问题匹配模型输出的匹配度评分作为回报,将所述原始问题样本作为训练样本,对作为生成器的所述问题生成模型进行强化学习训练,以进一步形成所述生成器和所述判别器之间的,以所述目标问题样本作为与所述原始问题样本对应的对抗样本的对抗训练;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010757542.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top