[发明专利]自动生成相似问句的方法和装置有效
申请号: | 201810856231.0 | 申请日: | 2018-07-27 |
公开(公告)号: | CN109033390B | 公开(公告)日: | 2020-02-18 |
发明(设计)人: | 潘晟锋;杨振宇;刘云峰;吴悦;陈正钦;胡晓;汶林丁 | 申请(专利权)人: | 深圳追一科技有限公司 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F40/279 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 张丹 |
地址: | 518000 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 生成 相似 问句 方法 装置 | ||
1.一种自动生成相似问句的方法,其特征在于,包括:
获取初始问句;
根据所述初始问句生成拓展问句,所述拓展问句是由第一深度学习模型生成的;
判断拓展问句是否为相似问句,采用第二深度学习模型判断拓展问句是否为相似问句;
根据判断结果标记出相似问句,包括:当一个拓展问句是相似问句时,将该拓展问句标记为相似问句并保留;当一个拓展问句不是相似问句时,所述第二深度学习模型向所述第一深度学习模型反馈判断结果;所述第一深度学习模型根据反馈的判断结果进行强化学习,调整生成拓展问句的策略;
所述第一深度学习模型为文本生成模型;所述文本生成模型为经过预训练的模型,用于利用预训练语料学习根据一个语句生成另外一个同义的语句;
所述第二深度学习模型为文本匹配模型;所述文本匹配模型为经过预训练的模型,用于利用预训练语料学习判断两个语句是否语义相同。
2.根据权利要求1所述的方法,其特征在于,所述根据所述初始问句生成拓展问句,包括:
将所述初始问句输入第一深度学习模型;
所述第一深度学习模型根据输入的所述初始问句自动输出若干个拓展问句。
3.根据权利要求1所述的方法,其特征在于,所述判断拓展问句是否为相似问句,包括:
将所述初始问句和一个拓展问句输入第二深度学习模型;
所述第二深度学习模型判断所述初始问句和输入的拓展问句是否语义相同;
如果语义相同,则输入的拓展问句是相似问句;如果语义不同,则输入的拓展问句不是相似问句。
4.一种自动生成相似问句的装置,其特征在于,包括:
获取模块,用于获取初始问句;
生成模块,用于根据所述初始问句生成拓展问句,所述拓展问句是由第一深度学习模型生成的;
判断模块,用于判断拓展问句是否为相似问句,采用第二深度学习模型判断拓展问句是否为相似问句;
标记模块,用于当一个拓展问句是相似问句时,将该拓展问句标记为相似问句并保留;
反馈模块,用于当一个拓展问句不是相似问句时,所述第二深度学习模型向所述第一深度学习模型反馈判断结果;所述第一深度学习模型根据反馈的判断结果进行强化学习,调整生成拓展问句的策略,所述第一深度学习模型为文本生成模型;所述文本生成模型为经过预训练的模型,用于利用预训练语料学习根据一个语句生成另外一个同义的语句;所述第二深度学习模型为文本匹配模型;所述文本匹配模型为经过预训练的模型,用于利用预训练语料学习判断两个语句是否语义相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳追一科技有限公司,未经深圳追一科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810856231.0/1.html,转载请声明来源钻瓜专利网。