[发明专利]用于翻译语句的方法和装置有效
申请号: | 201811543684.4 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109558605B | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 毕天驰;张传强;熊皓;何中军;李芝;王海峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例公开了用于生成翻译模型的方法和装置。该方法的一具体实施方式包括:基于将训练样本输入正向编码器和正向解码器所得到的正向翻译语句切分词概率序列,和将训练样本输入反向编码器和反向解码器所得到的反向翻译语句切分词概率序列确定总损失值,并在确定模型未训练完成时,调整正向编码器、正向解码器、反向编码器和反向解码器的模型参数直到确定模型训练完成。该实施方式降低了翻译过程中前面翻译错误对后面翻译所造成的影响。 | ||
搜索关键词: | 用于 翻译 语句 方法 装置 | ||
【主权项】:
1.一种用于生成翻译模型的方法,包括:获取训练样本集,其中,训练样本包括源语言的源语句切分词序列以及具有相同语义的目标语言的目标语句切分词序列;确定初始翻译模型,所述初始翻译模型包括正向编码器、正向解码器、反向编码器和反向解码器;对于所述训练样本集中的训练样本,执行以下输入步骤:将该训练样本中的源语句切分词序列分别输入所述正向编码器和所述反向编码器,得到第一语义向量和第二语义向量;将所得到的第一语义向量和该训练样本中的目标语句切分词序列输入所述正向解码器得到正向翻译语句切分词概率序列;将所得的第二语义向量和该训练样本中的目标语句切分词序列的反向序列输入所述反向解码器得到反向翻译语句切分词概率序列;执行以下损失值确定步骤:基于所述训练样本集中训练样本对应的正向翻译语句切分词概率序列和反向翻译语句切分词概率序列确定总损失值;利用机器学习方法调整所述初始翻译模型的模型参数后再次执行所述输入步骤和所述损失值确定步骤,直到根据所述总损失值和所述损失值阈值的比较结果确定模型训练完成,将所述初始翻译模型确定为所生成的翻译模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811543684.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种机器翻译方法、装置、电子设备及存储介质
- 下一篇:BIM招投标系统