[发明专利]一种翻译方法、装置以及用于翻译的装置在审
申请号: | 201711175025.5 | 申请日: | 2017-11-22 |
公开(公告)号: | CN107870904A | 公开(公告)日: | 2018-04-03 |
发明(设计)人: | 施亮亮;王宇光;李响;陈伟;姜里羊;阳家俊;卫林钰 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 任苏亚,王宝筠 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 翻译 方法 装置 以及 用于 | ||
技术领域
本申请涉及翻译技术领域,特别涉及一种翻译方法、装置以及一种用 于翻译的装置。
背景技术
随着互联网的普及,越来越多的用户有更多的机会接触到母语之外 的外语,在线翻译或者机器翻译等也随之越来越重要。一般情况下,以 源语言为中文,待翻译的目标语言为英语为例,可以预先获取到中文到 英文的大量双语句对作为训练数据来训练机器翻译模型,然后在用户需 要将中文翻译成英文的时候,直接将中文输入该机器翻译模型,并将机 器翻译模型翻译的英文作为翻译结果输出。
发明内容
发明人在研究过程中发现,现有技术中的机器翻译模型在翻译句子 的时候,部分结果并不足够准确。例如,以源语言为中文为例,对于单 词“apple”来说,在通信技术领域可能指代手机,而在食物的领域就指 代一种水果苹果,因此,对于待翻译的源语言来说,各个单词组成的句 子所在语言环境会影响翻译结果,如果没有按照源语言句子所处的语言 环境去翻译,那得到的目标句子就可能与用户想要的翻译结果相差较大, 使得翻译结果不够准确。
因此,为了考虑到源语言的语言环境的复杂性,在翻译源语言句子 之前,可以先对源语言句子进行分类,其中,具体的分类方式可以由本 领域技术人员自主设置,例如,按照口语、新闻和专利等方式进行分类, 或者按照娱乐、快讯、体育和天气预报等方式进行分类,等等。基于对 源语言句子的分类结果,再按照各类别分别对应的翻译模型来翻译源语 言句子,就可以使得按照具体的类别中源语言句子的特点来将源语言句 子翻译成目标语言句子,从而使得翻译结果尽可能地符合语言环境,不 仅提高了翻译结果的准确性,同时还能满足更多场景的翻译需求。
基于此,本申请提供了一种翻译方法,用以先对待翻译的源语言句 子进行分类,得到源语言句子的所属类别,再按照所属类别对应的翻译 方式,来翻译源语言句子以得到目标语言句子。
本申请还提供了一种翻译装置,用以保证上述方法在实际中的实现及 应用。
本申请提供的一种翻译方法,该方法包括:
获取待翻译的源语言句子;
确定所述源语言句子的所属类别;
按照所述所属类别对应的翻译方式,翻译所述源语言句子以得到目标 语言句子。
其中,所述确定所述源语言句子的所属类别,包括:
依据预先训练的文本分类模型,确定所述源语言句子的所属类别。
其中,所述文本分类模型通过以下方式训练:
获取为源语言预先分类好的各个类别,以及各个类别对应的训练源语 言句子;
分别抽取各个类别的源语言句子的句子特征,所述句子特征包括:句 子中词的长度、字的长度和/或句子中词的类型;
依据各个类别下的句子特征,训练源语言的句子分类模型。
其中,所述按照所述所属类别对应的翻译方式,翻译所述源语言句子 以得到目标语言句子,包括:
依据类别与翻译模型的对应关系,确定所述源语言句子的所属类别对 应的目标翻译模型;
依据所述目标翻译模型对所述源语言句子进行翻译,得到目标语言句 子。
其中,所述翻译模型通过以下方式训练得到:
获取预先分类好的各个类别,以及各个类别对应的训练源语言句子和 训练目标语言句子;
以每个类别对应的训练源语言句子和训练目标语言句子为训练数据, 分别训练各类别对应的各翻译模型。
本申请提供的一种翻译装置,该装置包括:
获取单元,用于获取待翻译的源语言句子;
确定单元,确定所述源语言句子的所属类别;
翻译单元,用于按照所述所属类别对应的翻译方式,翻译所述源语言 句子以得到目标语言句子。
其中,所述确定单元具体用于:
依据预先训练的文本分类模型,确定所述源语言句子的所属类别。
其中,所述文本分类模型通过以下方式训练:
获取为源语言预先分类好的各个类别,以及各个类别对应的训练源语 言句子;
分别抽取各个类别的源语言句子的句子特征,所述句子特征包括:句 子中词的长度、字的长度和/或句子中词的类型;
依据各个类别下的句子特征,训练源语言的句子分类模型。
其中,所述翻译单元,包括:
确定子单元,用于依据类别与翻译模型的对应关系,确定所述源语言 句子的所属类别对应的目标翻译模型;
翻译子单元,用于依据所述目标翻译模型对所述源语言句子进行翻 译,得到目标语言句子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711175025.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种石油运输管路防护带缠绕装置
- 下一篇:砼泵软管生产线增强层缠绕系统