[发明专利]翻译文本处理方法、装置、计算机设备和存储介质有效

申请号：	202010157566.0	申请日：	2020-03-09
公开（公告）号：	CN111368531B	公开（公告）日：	2023-04-14
发明（设计）人：	缪畅宇	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06F40/284	分类号：	G06F40/284;G06F40/42;G06N20/00
代理公司：	华进联合专利商标代理有限公司 44224	代理人：	李文渊
地址：	518000 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	翻译文本处理方法装置计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及一种翻译文本处理方法、装置、计算机设备和存储介质。所述方法包括：获取待翻译文本；将所述待翻译文本翻译为目标语言的译文文本；根据所述译文文本中各分词的上下文信息确定所述分词对应的处理标记；根据各所述分词对应的处理标记对所述译文文本中的所述分词进行过滤；依据过滤后所得的译文文本和所述处理标记，确定过滤后所得的译文文本中各分词所对应的目标词；按照所述处理标记和所述目标词对过滤后所得的译文文本中的分词进行修改，得到目标译文文本。采用本方法能够提高待翻译文本的翻译效果。

技术领域

本申请涉及人工智能技术领域，特别是涉及一种翻译文本处理方法、装置、计算机设备和存储介质。

背景技术

随着人工智能技术不断发展，人工智能技术在多个领域展开研究和应用。而自然语言处理(Nature Language Processing，NLP)是人工智能技术中的一个重要方向，常常被应用于文本处理方向，如文章自动摘要、文本自动纠错和文本优化。

在传统的文本处理方案中，通常是将待翻译文本输入至序列到序列(seq2seq)模型，然后利用该seq2seq模型对输入的待翻译文本进行翻译，从而生成目标译文文本。然而，在使用seq2seq模型来进行文本处理时，通常适用于生成一个全新的文本，而将待翻译文本翻译为目标译文文本，其实质上是一种语言的文本到另一种语言的文本，语义在翻译前后是一致的，因此采用seq2seq模型进行翻译时，将会影响待翻译文本的翻译效果。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高待翻译文本的翻译效果的翻译文本处理方法、装置、计算机设备和存储介质。

一种翻译文本处理方法，所述方法包括：

获取待翻译文本；

将所述待翻译文本翻译为目标语言的译文文本；

根据所述译文文本中各分词的上下文信息确定所述分词对应的处理标记；

根据各所述分词对应的处理标记对所述译文文本中的所述分词进行过滤；

依据过滤后所得的译文文本和所述处理标记，确定过滤后所得的译文文本中各分词所对应的目标词；

按照所述处理标记和所述目标词对过滤后所得的译文文本中的分词进行修改，得到目标译文文本。

一种翻译文本处理装置，其特征在于，所述装置包括：

获取模块，用于获取待翻译文本；

翻译模块，用于将所述待翻译文本翻译为目标语言的译文文本；