[发明专利]一种训练、使用数据转换模型的方法、装置及计算机设备在审
| 申请号: | 202110155510.6 | 申请日: | 2021-02-04 |
| 公开(公告)号: | CN113609863A | 公开(公告)日: | 2021-11-05 |
| 发明(设计)人: | 王龙跃;刘思佑;丁亮 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06N3/04 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 朱佳 |
| 地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 训练 使用 数据 转换 模型 方法 装置 计算机 设备 | ||
1.一种训练数据转换模型的方法,其特征在于,包括:
采用样本输入语义元素序列集合对数据转换模型进行训练,获得已训练的数据转换模型;其中,在一次训练过程中,针对所述样本输入语义元素序列集合中的样本输入语义元素序列,至少执行以下操作:
获得训练输出语义元素序列中的各个训练输出语义位置,与所述样本输入语义元素序列中各个样本输入语义元素之间的元素相关概率;
采用所述数据转换模型,基于获得的各个元素相关概率,分别获得所述各个训练输出语义位置各自对应的全局训练输出语义元素和局部训练输出语义元素,并基于获得的各个全局训练输出语义元素和各个局部训练输出语义元素,分别确定所述各个训练输出语义位置各自对应的目标训练输出语义元素,以获得所述训练输出语义元素序列,其中,所述全局训练输出语义元素与每个样本输入语义元素相关,所述局部训练输出语义元素与部分样本输入语义元素相关。
2.根据权利要求1所述的方法,其特征在于,获得训练输出语义元素序列中的各个训练输出语义位置,与样本输入语义元素序列中各个样本输入语义元素之间的元素相关概率,包括:
基于编码模型和解码模型学习的目标子数据的排列规则,分别确定所述各个训练输出语义位置各自对应的目标子数据在目标数据中的关联位置,与初始数据中所述各个样本输入语义位置各自对应的各个初始子数据之间的数据相关概率,其中,所述样本输入语义元素序列是采用所述编码模型对所述初始数据进行编码处理获得的,所述目标数据是采用与所述编码模型对应的所述解码模型对所述训练输出语义元素序列进行解码处理获得的;
基于获得的各个数据相关概率,确定所述训练输出语义元素序列中的各个训练输出语义位置,与所述样本输入语义元素序列中各个样本输入语义元素之间的元素相关概率。
3.根据权利要求1所述的方法,其特征在于,采用所述数据转换模型,基于获得的各个元素相关概率,获得所述各个训练输出语义位置各自对应的全局训练输出语义元素,包括:
针对所述各个训练输出语义位置,分别执行以下操作:
基于获得的各个元素相关概率,分别获得所述样本输入语义元素序列中的各个样本输入语义元素,对应于所述各个训练输出语义位置中的一个训练输出语义位置的第一元素权重;
基于所述各个样本输入语义元素对应的第一元素权重,对所述各个样本输入语义元素进行加权求和处理,获得所述一个训练输出语义位置对应的全局训练输出语义元素。
4.根据权利要求1所述的方法,其特征在于,采用所述数据转换模型,基于获得的各个元素相关概率,获得所述各个训练输出语义位置各自对应的局部训练输出语义元素,包括:
针对所述各个训练输出语义位置,分别执行以下操作:
基于获得的各个元素相关概率,在所述样本输入语义元素序列中,确定所述各个训练输出语义位置中的一个训练输出语义位置对应的目标相关样本输入语义元素;
基于获得的各个元素相关概率,分别获得所述样本输入语义元素序列中的各个目标相关样本输入语义元素,对应于所述一个训练输出语义位置的第二元素权重;
基于所述各个目标相关样本输入语义元素对应的第二元素权重,对所述各个目标相关样本输入语义元素进行加权求和处理,获得所述一个训练输出语义位置对应的局部训练输出语义元素。
5.根据权利要求4所述的方法,其特征在于,基于获得的各个元素相关概率,确定所述各个训练输出语义位置中的一个训练输出语义位置对应的目标相关样本输入语义元素,包括:
基于获得的各个元素相关概率,确定所述一个训练输出语义位置对应的最大元素相关概率,获得所述样本输入语义元素序列中,所述一个训练输出语义位置对应的最相关样本输入语义元素;或者,
在所述样本输入语义元素序列中,将与所述最相关样本输入语义元素满足预设相关条件的至少一个样本输入语义元素,确定为所述一个训练输出语义位置对应的目标相关样本输入语义元素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110155510.6/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





