[发明专利]文本翻译处理方法及装置有效
申请号: | 201711288979.7 | 申请日: | 2017-12-07 |
公开(公告)号: | CN108228574B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 刘俊华;孟廷;魏思;胡国平;柳林;王建社;方昕;李永超 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F16/36 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 翻译 处理 方法 装置 | ||
1.一种文本翻译处理方法,其特征在于,包括:
若第一识别文本的识别置信度大于第一预设阈值且第一目标语言文本的翻译置信度不大于第二预设阈值,则对所述第一目标语言文本进行翻译,得到第二识别文本,所述第一识别文本与所述第二识别文本对应相同的语种,所述第一目标语言文本由所述第一识别文本经过翻译后得到;
若所述第一识别文本与所述第二识别文本之间语义不等价,获取关键名词及所述关键名词的类型,所述第一识别文本中包含所述关键名词;其中,所述关键名词为一个整体分词;
基于所述关键名词的类型对所述关键名词进行翻译,得到第一翻译结果,对所述第一识别文本中除所述关键名词之外的其它内容进行翻译,得到第二翻译结果,将所述第一翻译结果与所述第二翻译结果进行合并得到第二目标语言文本。
2.根据权利要求1所述的方法,其特征在于,所述获取关键名词及所述关键名词的类型之前,还包括:
分别将所述第一识别文本及所述第二识别文本进行向量化,得到第一词向量序列以及第二词向量序列,并计算所述第一词向量序列与所述第二词向量序列之间的距离;
若所述第一词向量序列与所述第二词向量序列之间的距离不小于第三预设阈值,则确定所述第一识别文本与所述第二识别文本之间语义不等价。
3.根据权利要求1所述的方法,其特征在于,所述基于所述关键名词的类型对所述关键名词进行翻译,得到第一翻译结果,包括:
根据所述关键名词的类型确定对应的占位符,将所述占位符转化成翻译后的目标语言名词,并作为所述第一翻译结果。
4.根据权利要求1所述的方法,其特征在于,所述获取关键名词及所述关键名词的类型,包括:
获取关键文本,对所述关键文本进行语义解析,得到所述关键文本中的关键名词以及每一关键名词的类型。
5.根据权利要求1所述的方法,其特征在于,所述对所述第一目标语言文本进行翻译,得到第二识别文本之后,还包括:
若所述第一识别文本与所述第二识别文本之间语义不等价,则获取第三识别文本,并基于所述第三识别文本,重新执行文本翻译处理流程;其中,所述第三识别文本为重新输入的语音信号对应的识别文本,所述第一识别文本与所述第三识别文本之间文本数据不同且语义等价。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述第一识别文本的识别置信度不大于第一预设阈值且检测到所述第一识别文本的确认无误指令,则将所述第一识别文本的识别置信度重置为识别置信度的最大取值,并重新执行文本翻译处理流程;
若所述第一识别文本的识别置信度不大于第一预设阈值且检测到所述第一识别文本的确认有误指令,获取文本修改指令,根据所述文本修改指令对所述第一识别文本进行修改,并重新执行文本翻译处理流程。
7.根据权利要求1所述的方法,其特征在于,所述对所述第一目标语言文本进行翻译,得到第二识别文本之前,还包括:
根据所述第一识别文本中每一分词出现的后验概率以及分词数量,计算所述第一识别文本的识别置信度;
根据所述第一目标语言文本中每一目标分词出现的翻译概率以及目标分词数量,计算所述第一目标语言文本的翻译置信度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711288979.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文本情感分析方法、装置及电子设备
- 下一篇:语音翻译交互方法及系统