[发明专利]统一的对话理解方法及框架在审
申请号: | 202210342533.2 | 申请日: | 2022-03-31 |
公开(公告)号: | CN114896988A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 俞凯;陈露;陈志 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;侯晓艳 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 统一 对话 理解 方法 框架 | ||
1.一种统一的对话理解方法,包括:
将各类别的对话理解任务按照统一的生成范式转换为多个生成式对话任务;
将所述多个生成式对话任务输入至任务统一生成式模型,输出与所述多个生成式对话任务对应的任务标识和任务答案,以解决各类别的对话理解任务。
2.根据权利要求1所述的方法,其中,所述将各类别的对话理解任务按照统一的生成范式转换为多个生成式对话任务包括:
将各类别的对话理解任务按照统一的生成范式转换为包括任务标识、对话内容、任务描述的多个生成式对话任务,其中,所述对话理解任务的类别包括:对话摘要、补全对话、意图检测、时隙填充和对话状态跟踪。
3.根据权利要求1所述的方法,其中,所述任务统一生成式模型采用以下步骤训练:
将各类别的对话理解任务训练数据按照统一的生成范式转换为多个生成式对话任务训练数据;
利用所述多个生成式对话任务训练数据对所述任务统一生成式模型进行多任务联合训练,输出与所述多个生成式对话任务训练数据对应的预测任务标识和预测任务答案,其中,所述多个生成式对话任务共享同一训练参数;
基于所述基准任务标识和基准任务答案训练与所述预测任务标识和预测任务答案的误差对所述任务统一生成式模型优化,直至所述误差收敛时训练结束。
4.根据权利要求3所述的方法,其中,所述多任务联合训练的训练策略包括:
对所有生成式对话任务分配相同的权重,实施平均和策略;和/或
利用启发式训练计划,对不同的生成式对话任务计划各自的训练过程,以实现可配置的人工调度策略;和/或
确定不同的生成式对话任务的损失权重,用于平衡各损失权重全局优化的学习权重策略。
5.根据权利要求3所述的方法,其中,所述用于平衡各损失权重全局优化的学习权重策略包括:同态不确定性权重、梯度归一化梯度范数。
6.一种统一的对话理解框架,包括:
统一转换程序模块,用于将各类别的对话理解任务按照统一的生成范式转换为多个生成式对话任务;
对话理解程序模块,用于将所述多个生成式对话任务输入至任务统一生成式模型,输出与所述多个生成式对话任务对应的任务标识和任务答案,以解决各类别的对话理解任务。
7.根据权利要求6所述的对话理解框架,其中,所述统一转换程序模块用于:
将各类别的对话理解任务按照统一的生成范式转换为包括任务标识、对话内容、任务描述的多个生成式对话任务,其中,所述对话理解任务的类别包括:对话摘要、补全对话、意图检测、时隙填充和对话状态跟踪。
8.根据权利要求6所述的对话理解框架,其中,所述任务统一生成式模型采用以下步骤训练:
将各类别的对话理解任务训练数据按照统一的生成范式转换为多个生成式对话任务训练数据;
利用所述多个生成式对话任务训练数据对所述任务统一生成式模型进行多任务联合训练,输出与所述多个生成式对话任务训练数据对应的预测任务标识和预测任务答案,其中,所述多个生成式对话任务共享同一训练参数;
基于所述基准任务标识和基准任务答案训练与所述预测任务标识和预测任务答案的误差对所述任务统一生成式模型优化,直至所述误差收敛时训练结束。
9.根据权利要求8所述的对话理解框架,其中,所述多任务联合训练的训练策略包括:
对所有生成式对话任务分配相同的权重,实施平均和策略;和/或
利用启发式训练计划,对不同的生成式对话任务计划各自的训练过程,以实现可配置的人工调度策略;和/或
确定不同的生成式对话任务的损失权重,用于平衡各损失权重全局优化的学习权重策略。
10.根据权利要求9所述的对话理解框架,其中,所述用于平衡各损失权重全局优化的学习权重策略包括:同态不确定性权重、梯度归一化梯度范数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210342533.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:自动驾驶车辆实时监控视频传输系统
- 下一篇:语音交互方法、装置及存储介质