[发明专利]语言处理方法及装置、语言处理系统的训练方法及装置有效
申请号: | 201910867015.0 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110598222B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 徐智涛;唐剑波;李长亮;郭馨泽 | 申请(专利权)人: | 北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06N3/0442;G06N3/0455;G06N3/0464;G06N3/08 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 王治东 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了语言处理方法及装置、语言处理系统的训练方法及装置,其中,所述语言处理方法包括:将包括多个待翻译语句的目标段落输入翻译模型,得到每个待翻译语句对应的翻译语句;将包含连接词的翻译语句中的连接词替换为连接标记,将不包含连接词的翻译语句中插入连接标记,生成每个翻译语句对应的标记翻译语句;将多个标记翻译语句输入已训练好的语言模型,语言模型将连接标记删除或替换为对应的最终连接词,得到每个标记翻译语句对应的最终翻译语句,根据每个标记翻译语句对应的最终翻译语句拼接得到翻译段落,从而使段落的翻译结果的语义表达更加流畅,实现了目标任务语言处理的有效提升。 | ||
搜索关键词: | 语言 处理 方法 装置 系统 训练 | ||
【主权项】:
1.一种语言处理系统的训练方法,其特征在于,所述方法包括:/n将样本段落中的多个待翻译样本语句及对应的翻译样本语句作为平行语料输入至翻译模型进行训练,直至满足翻译模型的训练停止条件;/n将所述样本段落中包含连接词的翻译样本语句中的连接词更换为连接标记,将未包含连接词的所述翻译样本语句中插入所述连接标记,生成每个翻译样本语句对应的标记翻译样本语句;/n将多个所述标记翻译样本语句输入至语言模型进行训练,直至满足语言模型的训练停止条件。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司,未经北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910867015.0/,转载请声明来源钻瓜专利网。