[发明专利]一种多轮对话模型训练方法、多轮对话的生成方法及装置在审
申请号: | 202211157408.0 | 申请日: | 2022-09-22 |
公开(公告)号: | CN115563243A | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 赵亚东 | 申请(专利权)人: | 太保科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06N20/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张志梅 |
地址: | 200010 上海市黄浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 轮对 模型 训练 方法 生成 装置 | ||
本申请提供了一种多轮对话模型训练方法、多轮对话的生成方法及装置,通过获取任务场景,并根据获取到的任务场景预设意图类型数据、槽位种子模板、机器人行为以及与所述机器人行为对应的机器人回复数据,并构建多轮对话策略图,根据所述多轮对话策略图构建多轮对话数据集,由于多轮对话数据集可以通过多轮对话策略图中包含的元素以及数据进行自动生成,所以降低了训练样本形成过程中的人工参与程度,提高了模型训练效率。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种多轮对话模型训练方法、多轮对话的生成方法及装置。
背景技术
人工智能对话系统产品形态主要包括单轮对话和多轮对话两种,单轮对话模式是用户输入一句话,对话机器人根据用户输入的话给一个答案,主要场景是常见问题解答,或者是帮助中心。多轮对话时对话机器人在回答时会记住会话的历史信息,在内部维护一个对话状态,综合对话状态和用户输入给一个答案。多轮对话的定义是,根据上下文内容,进行连续的对话,以达到解决某一类特定任务的目的。
现有技术中,为完成多轮对话,需要定制具有多轮对话能力的人工智能模型。其构建流程是,人工梳理业务服务流程,针对每个节点收集单个轮次语料开发意图、槽位模型,基于意图槽位模型输出,人工编写流程语料训练行动预测模型,再根据行为预测输出,采取相应的回复和行为。
现有技术缺点在于,需要大量人工去梳理和撰写意图、槽位、对话数据作为训练样本以满足模型训练要求,但是人工编写出的样本会出现覆盖不全面的问题,因此模型训练效率低,训练数据撰写过程的人工参与程度高。
发明内容
基于此,本申请实施例提供了一种多轮对话模型训练方法、多轮对话的生成方法及装置,旨在提高模型训练效率且降低训练样本数据编写中的人工参与程度。
第一方面,本申请实施例提供了一种多轮对话模型训练方法,所述方法包括:
获取任务场景;
根据所述任务场景获取意图类型集合;
根据所述任务场景获取槽位种子模板,其中,所述槽位种子模板包括有槽位类型和与所述槽位类型对应的槽位值;
构建三元组数据,其中,一个所述三元组数据包含所述意图类型集合中的一种意图类型,一种所述槽位类型以及一个与所述槽位类型对应的槽位值;
根据所述任务场景获取机器人行为以及与所述机器人行为对应的机器人回复数据;
根据所述三元组数据与所述机器人行为以及与所述机器人行为对应的机器人回复数据构建多轮对话策略图;
根据所述多轮对话策略图构建多轮对话数据集;
将所述多轮对话数据集作为模型训练样本,训练得到多轮对话模型。
可选的,根据所述任务场景获取槽位种子模板包括:
根据所述任务场景确定槽位类型集合;
从所述槽位类型集合中获取一个槽位类型,根据所述槽位类型确定槽位值;
将所述槽位类型与槽位值确定为槽位种子模版。
优选地,所述根据所述任务场景获取槽位种子模板包括:
根据所述任务场景确定槽位类型集合;
从所述槽位类型集合中获取一个槽位类型,针对所述槽位类型确定槽位值;
将所述槽位类型与槽位值确定为槽位种子模版;
采样至少两个槽位种子模板并进行拼接,得到复杂化的槽位种子模板。
可选的,根据所述三元组数据与所述机器人行为以及与所述机器人行为对应的机器人回复数据构建多轮对话策略图包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太保科技有限公司,未经太保科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211157408.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种P91钢锭的生产方法
- 下一篇:容器化服务漏洞检测方法、装置和服务器