[发明专利]一种多领域机器翻译网络训练方法及系统在审
申请号: | 202010719198.4 | 申请日: | 2020-07-23 |
公开(公告)号: | CN112115725A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 陈巍华 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06N3/08 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 安琪 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种多领域机器翻译网络训练方法及系统,所述方法执行以下步骤:将领域标志信息融合到多领域训练数据中;将融合的多领域训练数据分批次传入神经网络进行交替训练,得到交替数据流;生成具有领域嵌入层的端到端的翻译网络;基于所述交替数据流,对所述具有领域嵌入层的端到端的翻译网络进行训练,得到具备多领域翻译能力的多领域翻译网络模型。根据本发明的方法,使用多领域批交替训练的方法能有效缓解训练数据分布不均匀的情况,保证每个领域都能同时训练,这样可以提升各个领域的翻译效果;由于在领域批交替训练的过程中,基础领域和垂直领域是同时训练的,因此能有效缓解基础领域翻译效果的降低。 | ||
搜索关键词: | 一种 领域 机器翻译 网络 训练 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010719198.4/,转载请声明来源钻瓜专利网。