[发明专利]文本改写方法、装置、存储介质及电子设备在审
申请号: | 202110462242.2 | 申请日: | 2021-04-27 |
公开(公告)号: | CN113177419A | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 夏小强 | 申请(专利权)人: | 北京小米移动软件有限公司;北京小米松果电子有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/166 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 王晓霞 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 改写 方法 装置 存储 介质 电子设备 | ||
本公开涉及一种文本改写方法、装置、存储介质及电子设备,所述方法包括:获取对话输入;根据所述对话输入,在语料库中确定与所述对话输入对应的候选回复,所述语料库包括历史对话输入与历史候选回复之间的对应关系;将所述对话输入和所述候选回复输入至训练好的文本改写模型,确定针对所述候选回复的字符调整信息和改写文本;根据所述字符调整信息和所述改写文本,对所述对话输入进行回复。利用文本改写模型确定与对话输入对应的候选回复的字符调整信息和改写文本,其中,字符调整信息用于对候选回复进行改写,以丰富候选回复的语义信息,并利用改写文本对对话输入进行回复,能够有利于提升对话质量。
技术领域
本公开涉及自然语言处理技术领域,尤其涉及一种文本改写方法、装置、存储介质及电子设备。
背景技术
相关技术中,文本编辑任务随着深度学习模型的迭代与更新有了长足的进步。常见的文本编辑任务有回复改写,回复重生成和文本纠错等。其中,回复改写的目的是使被改写语句在改写之后能够表达更完整的语义信息,因此,回复改写也逐渐成为研究文本编辑任务的一个重要分支。
发明内容
为克服相关技术中存在的问题,本公开提供一种文本改写方法、装置、存储介质及电子设备。
根据本公开实施例的第一方面,提供一种文本改写方法,包括:
获取对话输入;
根据所述对话输入,在语料库中确定与所述对话输入对应的候选回复,所述语料库包括历史对话输入与历史候选回复之间的对应关系;
将所述对话输入和所述候选回复输入至训练好的文本改写模型,确定针对所述候选回复的字符调整信息和改写文本;
根据所述字符调整信息和所述改写文本,对所述对话输入进行回复。
在一些实施例中,所述方法还包括:
根据所述对话输入,识别与所述对话输入对应的目标实体信息;
根据所述对话输入及所述目标实体信息,在所述语料库中确定对应的所述候选回复,所述语料库还包括历史对话输入、历史实体信息、历史候选回复之间的对应关系;
所述将所述对话输入和所述候选回复输入至训练好的文本改写模型,确定针对所述候选回复的字符调整信息和改写文本,包括:
将所述对话输入和根据所述目标实体信息确定的候选回复输入至训练好的文本改写模型,确定与该候选回复对应的字符调整信息和改写文本。
在一些实施例中,所述根据所述对话输入,在语料库中确定与所述对话输入对应的候选回复,包括:
针对所述语料库中的每一所述历史对话输入,确定该历史对话输入与所述对话输入的相似度;
将相似度最高的K个历史对话输入所分别对应的历史候选回复分别作为与所述对话输入对应的初始候选回复,所述K为大于0的正整数;
对所有所述初始候选回复进行排序,并根据排序结果从所有所述初始候选回复中确定与所述对话输入对应的候选回复。
在一些实施例中,所述候选回复为多个,所述将所述对话输入和所述候选回复输入至训练好的文本改写模型,确定针对所述候选回复的字符调整信息和改写文本,包括:
针对每一所述候选回复,将所述对话输入和该候选回复输入至训练好的所述文本改写模型,得到与该候选回复对应的字符调整信息和改写文本;
所述根据所述字符调整信息和所述改写文本,对所述对话输入进行回复,包括:
通过所述文本改写模型从所有所述改写文本中确定与所述对话输入对应的目标回复文本,并根据所述目标回复文本对所述对话输入进行回复。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司;北京小米松果电子有限公司,未经北京小米移动软件有限公司;北京小米松果电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110462242.2/2.html,转载请声明来源钻瓜专利网。