[发明专利]连续长语音文件的翻译方法与翻译机在审
申请号: | 201711388000.3 | 申请日: | 2017-12-20 |
公开(公告)号: | CN108090051A | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 郑勇;金志军;王文祺 | 申请(专利权)人: | 深圳市沃特沃德股份有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
地址: | 518000 广东省深圳市南山区蛇口*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音文件 非语音段 语音段 翻译 音频码流 翻译机 服务器 解析 时序 分布次序 排序位置 语言背景 自然间隔 语句 替换 语音 发送 节奏 保留 | ||
本发明揭示了连续长语音文件的翻译方法与翻译机,其中,连续长语音文件的翻译方法,包括:解析所述连续长语音文件,得到各第一语音段和各第一非语音段,其中,各第一语音段和各第一非语音段按照在所述连续长语音中生成的时序分布;发送所述连续长语音文件至服务器进行翻译,并接收所述服务器翻译所述连续长语音文件后的音频码流文件;解析所述音频码流文件,得到与所述各第一语音段和各第一非语音段分布次序相同的各第二语音段和各第二非语音段;在所述音频码流文件中将相同排序位置的所述第一非语音段替换掉所述第二非语音段,得到最终的翻译语音文件。本发明保留了连续长语音文件的节奏、语言背景音和语句自然间隔,提高用户的使用体验。
技术领域
本发明涉及到电子翻译技术,特别是涉及到连续长语音文件的翻译方法与翻译机。
背景技术
在电子翻译领域,教育、录音翻译等应用场景下的连续长语音文件通过语音识别引擎、翻译引擎、合成引擎协同作用,得到翻译后的语音文件,并通过翻译机等电子设备终端输出,方便了不同语言用户的相互交流沟通,为人们的生活提供了极大的便利。但现有翻译引擎对连续长语音文件中的每个语音段翻译输出的语音文件没有背景噪音信息,而且语音文件中的语句间隔是预先设定的固定输出间隔,使得翻译后的语音文件脱离了原始连续长语音文件的节奏和语句自然间隔,失去了原始连续长语音文件的语言环境和情趣,用户体验性能差。
因此,现有技术还有待改进。
发明内容
本发明的主要目的为提供一种连续长语音文件的翻译方法,旨在解决现有翻译技术中不能保留原始连续长语音文件的节奏和语句自然间隔的技术问题。
本发明提出一种连续长语音文件的翻译方法,包括:
解析连续长语音文件,得到各第一语音段和各第一非语音段,其中,各第一语音段和各第一非语音段按照在上述连续长语音中生成的时序分布;
发送上述连续长语音文件至服务器进行翻译,并接收上述服务器翻译上述连续长语音文件后的音频码流文件;
解析上述音频码流文件,得到与上述各第一语音段和各第一非语音段分布次序相同的各第二语音段和各第二非语音段;
在上述音频码流文件中将相同排序位置的上述第一非语音段替换掉上述第二非语音段,得到最终的翻译语音文件。
优选地,上述解析连续长语音文件,得到各第一语音段和各第一非语音段的步骤,包括:
通过语音活动检测分析技术处理上述连续长语音文件,获得第一语音帧和第一非语音帧的排布状态;
根据上述第一语音帧和第一非语音帧的排布状态获得各第一语音段和各第一非语音段。
优选地,上述根据上述第一语音帧和第一非语音帧的排布状态获得各第一语音段和各第一非语音段的步骤,包括:
将连续排布的第一语音帧分别合成各上述第一语音段,将连续排布的第一非语音帧分别合成各上述第一非语音段。
优选地,上述将连续排布的第一语音帧分别合成各上述第一语音段,将连续排布的第一非语音帧分别合成各上述第一非语音段的步骤之后,包括:
提取各上述第一非语音段;
将各上述第一非语音段按照在上述连续长语音中生成的时序存储于非语音段缓存区;
优选地,上述发送上述连续长语音文件至服务器进行翻译,并接收上述服务器翻译上述连续长语音文件后的音频码流文件的步骤,包括:
将连续长语音文件发送至语音识别服务器;
接收上述语音识别服务器反馈的与上述连续长语音文件对应的第一文本文件;
将上述第一文本文件发送至翻译服务器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市沃特沃德股份有限公司,未经深圳市沃特沃德股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711388000.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于深度神经网络的游戏翻译系统
- 下一篇:语音翻译方法和装置