[发明专利]文本翻译处理方法及装置有效
申请号: | 201711288979.7 | 申请日: | 2017-12-07 |
公开(公告)号: | CN108228574B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 刘俊华;孟廷;魏思;胡国平;柳林;王建社;方昕;李永超 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F16/36 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 翻译 处理 方法 装置 | ||
本发明实施例提供一种文本翻译处理方法及装置,属于语言处理技术领域。该方法包括:若第一识别文本的识别置信度大于第一预设阈值且第一目标语言文本的翻译置信度不大于第二预设阈值,则对第一目标语言文本进行翻译,得到第二识别文本;若第一识别文本与第二识别文本之间语义不等价,获取关键名词及关键名词的类型;基于关键名词的类型对关键名词进行翻译,得到第一翻译结果,对第一识别文本中除关键名词之外的其它内容进行翻译,得到第二翻译结果,将第一翻译结果与第二翻译结果进行合并得到第二目标语言文本。由于可将第一识别文本中的关键名词作为一个整体分词,按照关键名词类型对关键名词进行翻译,从而可使得翻译结果更加准确。
技术领域
本发明实施例涉及语言处理技术领域,更具体地,涉及一种文本 翻译处理方法及装置。
背景技术
语言沟通成为不同语言种族群体相互交流面临的一个重要课题。 传统语言服务行业采用人工陪同口译、交替口译以及同声传译等解决 语言沟通障碍问题,但受限于人力不足以及成本限制,无法满足普通 人对不同语言沟通交流的需求。语音翻译技术的发展对传统语言口译 服务行业做出了有益补充,为普通人日常沟通交流提供了另一条途径, 并在成本、时效性等方面更具优势。
语音翻译过程一般由三部分组成,分别是语音识别、机器翻译和 语音合成。语音翻译时通常采用翻译结果单向传递模式,也即当语音 识别或者机器翻译出错时,会引发错误信息的传递。尤其是对于一些 人名、地名及机构名,由于这些实体名词大都属于稀有词汇,在语音 识别和机器翻译的训练语料中出现比例较少,甚至从未出现过,从而 在识别和翻译过程中比较容易出错,影响了在实际应用中语音翻译的 效果。
发明内容
为了解决上述问题,本发明实施例提供一种克服上述问题或者至 少部分地解决上述问题的文本翻译处理方法及装置。
根据本发明实施例的第一方面,提供了一种文本翻译处理方法, 该方法包括:
若第一识别文本的识别置信度大于第一预设阈值且第一目标语言 文本的翻译置信度不大于第二预设阈值,则对第一目标语言文本进行 翻译,得到第二识别文本,第一识别文本与第二识别文本对应相同的 语种,第一目标语言文本由第一识别文本经过翻译后得到;
若第一识别文本与第二识别文本之间语义不等价,获取关键名词 及关键名词的类型,第一识别文本中包含关键名词;
基于关键名词的类型对关键名词进行翻译,得到第一翻译结果, 对第一识别文本中除关键名词之外的其它内容进行翻译,得到第二翻 译结果,将第一翻译结果与第二翻译结果进行合并得到第二目标语言 文本。
本发明实施例提供的方法,通过在第一识别文本的识别置信度大 于第一预设阈值且第一目标语言文本的翻译置信度不大于第二预设阈 值时,对第一目标语言文本进行翻译,得到第二识别文本。若第一识 别文本与第二识别文本之间语义不等价,获取关键名词及关键名词的 类型。基于关键名词的类型对关键名词进行翻译,得到第一翻译结果, 对第一识别文本中除关键名词之外的其它内容进行翻译,得到第二翻 译结果,将第一翻译结果与第二翻译结果进行合并得到第二目标语言 文本。由于在识别正确而翻译错误的情况下,可对第一目标语言文本 进行反向翻译得到第二识别文本,在第一识别文本与第二识别文本之 间语义不等价的情况下,可将第一识别文本中的关键名词作为一个整 体分词,并按照关键名词的类型对关键名词进行翻译,从而可使得翻 译结果更加准确。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方 式中,获取关键名词及关键名词的类型之前,还包括:
分别将第一识别文本及第二识别文本进行向量化,得到第一词向 量序列以及第二词向量序列,并计算第一词向量序列与第二词向量序 列之间的距离;
若第一词向量序列与第二词向量序列之间的距离不小于第三预设 阈值,则确定第一识别文本与第二识别文本之间语义不等价。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711288979.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文本情感分析方法、装置及电子设备
- 下一篇:语音翻译交互方法及系统