[发明专利]对话模型的训练方法、装置、设备和存储介质有效
申请号: | 202110348055.1 | 申请日: | 2021-03-31 |
公开(公告)号: | CN113239157B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 黄信娴;鲍思琪;何煌;王凡;吴华;何径舟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06V10/774;G06V10/764;G06K9/62;G06N20/00 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 模型 训练 方法 装置 设备 存储 介质 | ||
1.一种对话模型的训练方法,所述对话模型包括知识选择模型和回复生成模型,所述方法包括:
采用所述知识选择模型,处理对话样本和知识库,以确定与所述对话样本匹配的知识,并确定所述知识对应的第一概率,所述第一概率为所述知识被选中的概率;
采用所述回复生成模型,处理所述对话样本和所述知识,以确定预测回复对应的第二概率,所述第二概率为所述预测回复为回复样本的概率;
基于所述第一概率和所述第二概率,确定边际损失函数,并基于所述边际损失函数训练所述知识选择模型和所述回复生成模型。
2.根据权利要求1所述的方法,其中,所述回复生成模型包括输入层、隐层和输出层,所述采用所述回复生成模型,处理所述对话样本和所述知识,以确定预测回复对应的第二概率,包括:
采用所述输入层对所述对话样本和所述知识信息处理,以得到输入向量;
采用所述隐层对所述输入向量进行处理,以得到状态向量;
采用所述输出层对所述状态向量进行处理,以确定预测回复对应的第二概率。
3.根据权利要求2所述的方法,其中,所述输入层包括:类型嵌入层,所述类型嵌入层的输入包括互不相同的对话信息类型标识、知识类型标识和回复类型标识。
4.根据权利要求2所述的方法,其中,所述隐层包括:自注意力模型,所述自注意力模型包括第一部分和第二部分,所述第一部分是对话样本和知识对应的部分,所述第二部分是已生成回复对应的部分,所述第一部分采用双向自注意力机制,所述第二部分采用单向自注意力机制。
5.根据权利要求1-4任一项所述的方法,其中,所述知识选择模型包括编码模型,所述匹配的知识从所述知识库中确定,所述知识库包括至少一个知识,所述采用所述知识选择模型,处理对话样本,以确定与所述对话样本匹配的知识,包括:
采用所述编码模型,将对话样本编码成对话向量,以及,将所述知识库中各个知识分别编码成知识向量;
确定所述对话向量与所述知识向量的内积值;
按照所述内积值从大到小的顺序,选择预设个数的知识,确定为与所述对话样本匹配的知识。
6.根据权利要求5所述的方法,其中,所述确定所述知识对应的第一概率,包括:
对所述知识对应的内积值进行归一化处理,以得到归一化值,将所述归一化值确定为所述知识对应的第一概率。
7.一种对话模型的训练装置,所述对话模型包括知识选择模型和回复生成模型,所述装置包括:
知识选择模块,用于采用所述知识选择模型,处理对话样本和知识库,以确定与所述对话样本匹配的知识,并确定所述知识对应的第一概率,所述第一概率为所述知识被选中的概率;
回复生成模块,用于采用所述回复生成模型,处理所述对话样本和所述知识,以确定预测回复对应的第二概率,所述第二概率为所述预测回复为回复样本的概率;
训练模块,用于基于所述第一概率和所述第二概率,确定边际损失函数,并基于所述边际损失函数训练所述知识选择模型和所述回复生成模型。
8.根据权利要求7所述的装置,其中,所述回复生成模型包括输入层、隐层和输出层,所述回复生成模块具体用于:
采用所述输入层对所述对话样本和所述知识信息处理,以得到输入向量;
采用所述隐层对所述输入向量进行处理,以得到状态向量;
采用所述输出层对所述状态向量进行处理,以确定预测回复对应的第二概率。
9.根据权利要求8所述的装置,其中,所述输入层包括:类型嵌入层,所述类型嵌入层的输入包括互不相同的对话信息类型标识、知识类型标识和回复类型标识。
10.根据权利要求8所述的装置,其中,所述隐层包括:自注意力模型,所述自注意力模型包括第一部分和第二部分,所述第一部分是对话样本和知识对应的部分,所述第二部分是已生成回复对应的部分,所述第一部分采用双向自注意力机制,所述第二部分采用单向自注意力机制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110348055.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于磁性复合粒子的重金属污染土壤修复方法
- 下一篇:一种全自动甘蔗种植机