[发明专利]翻译文本处理方法、装置、计算机设备和存储介质有效
申请号: | 202010157566.0 | 申请日: | 2020-03-09 |
公开(公告)号: | CN111368531B | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 缪畅宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/42;G06N20/00 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 李文渊 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译 文本 处理 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种翻译文本处理方法、装置、计算机设备和存储介质。所述方法包括:获取待翻译文本;将所述待翻译文本翻译为目标语言的译文文本;根据所述译文文本中各分词的上下文信息确定所述分词对应的处理标记;根据各所述分词对应的处理标记对所述译文文本中的所述分词进行过滤;依据过滤后所得的译文文本和所述处理标记,确定过滤后所得的译文文本中各分词所对应的目标词;按照所述处理标记和所述目标词对过滤后所得的译文文本中的分词进行修改,得到目标译文文本。采用本方法能够提高待翻译文本的翻译效果。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种翻译文本处理方法、装置、计算机设备和存储介质。
背景技术
随着人工智能技术不断发展,人工智能技术在多个领域展开研究和应用。而自然语言处理(Nature Language Processing,NLP)是人工智能技术中的一个重要方向,常常被应用于文本处理方向,如文章自动摘要、文本自动纠错和文本优化。
在传统的文本处理方案中,通常是将待翻译文本输入至序列到序列(seq2seq)模型,然后利用该seq2seq模型对输入的待翻译文本进行翻译,从而生成目标译文文本。然而,在使用seq2seq模型来进行文本处理时,通常适用于生成一个全新的文本,而将待翻译文本翻译为目标译文文本,其实质上是一种语言的文本到另一种语言的文本,语义在翻译前后是一致的,因此采用seq2seq模型进行翻译时,将会影响待翻译文本的翻译效果。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高待翻译文本的翻译效果的翻译文本处理方法、装置、计算机设备和存储介质。
一种翻译文本处理方法,所述方法包括:
获取待翻译文本;
将所述待翻译文本翻译为目标语言的译文文本;
根据所述译文文本中各分词的上下文信息确定所述分词对应的处理标记;
根据各所述分词对应的处理标记对所述译文文本中的所述分词进行过滤;
依据过滤后所得的译文文本和所述处理标记,确定过滤后所得的译文文本中各分词所对应的目标词;
按照所述处理标记和所述目标词对过滤后所得的译文文本中的分词进行修改,得到目标译文文本。
一种翻译文本处理装置,其特征在于,所述装置包括:
获取模块,用于获取待翻译文本;
翻译模块,用于将所述待翻译文本翻译为目标语言的译文文本;
第一确定模块,用于根据所述译文文本中各分词的上下文信息确定所述分词对应的处理标记;
过滤模块,用于根据各所述分词对应的处理标记对所述译文文本中的所述分词进行过滤;
第二确定模块,用于依据过滤后所得的译文文本和所述处理标记,确定过滤后所得的译文文本中各分词所对应的目标词;
修改模块,用于按照所述处理标记和所述目标词对过滤后所得的译文文本中的分词进行修改,得到目标译文文本。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待翻译文本;
将所述待翻译文本翻译为目标语言的译文文本;
根据所述译文文本中各分词的上下文信息确定所述分词对应的处理标记;
根据各所述分词对应的处理标记对所述译文文本中的所述分词进行过滤;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010157566.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:对中杆气泡校中方法
- 下一篇:一种通讯防监听方法及装置