[发明专利]连续长语音文件的翻译方法与翻译机在审
申请号: | 201711388000.3 | 申请日: | 2017-12-20 |
公开(公告)号: | CN108090051A | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 郑勇;金志军;王文祺 | 申请(专利权)人: | 深圳市沃特沃德股份有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
地址: | 518000 广东省深圳市南山区蛇口*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音文件 非语音段 语音段 翻译 音频码流 翻译机 服务器 解析 时序 分布次序 排序位置 语言背景 自然间隔 语句 替换 语音 发送 节奏 保留 | ||
1.一种连续长语音文件的翻译方法,其特征在于,包括:
解析连续长语音文件,得到各第一语音段和各第一非语音段,其中,各第一语音段和各第一非语音段按照在所述连续长语音中生成的时序分布;
发送所述连续长语音文件至服务器进行翻译,并接收所述服务器翻译所述连续长语音文件后的音频码流文件;
解析所述音频码流文件,得到与所述各第一语音段和各第一非语音段分布次序相同的各第二语音段和各第二非语音段;
在所述音频码流文件中将相同排序位置的所述第一非语音段替换掉所述第二非语音段,得到最终的翻译语音文件。
2.根据权利要求1所述的连续长语音文件的翻译方法,其特征在于,所述解析连续长语音文件,得到各第一语音段和各第一非语音段的步骤,包括:
通过语音活动检测分析技术处理所述连续长语音文件,获得第一语音帧和第一非语音帧的排布状态;
根据所述第一语音帧和第一非语音帧的排布状态获得各第一语音段和各第一非语音段。
3.根据权利要求2所述的连续长语音文件的翻译方法,其特征在于,所述根据所述第一语音帧和第一非语音帧的排布状态获得各第一语音段和各第一非语音段的步骤,包括:
将连续排布的第一语音帧分别合成各所述第一语音段,将连续排布的第一非语音帧分别合成各所述第一非语音段。
4.根据权利要求1所述的连续长语音文件的翻译方法,其特征在于,所述发送所述连续长语音文件至服务器进行翻译,并接收所述服务器翻译所述连续长语音文件后的音频码流文件的步骤,包括:
将连续长语音文件发送至语音识别服务器;
接收所述语音识别服务器反馈的与所述连续长语音文件对应的第一文本文件;
将所述第一文本文件发送至翻译服务器;
接收所述翻译服务器反馈的翻译所述第一文本文件后的指定语种的第二文本文件;
将所述第二文本文件发送至语音合成服务器;
接收所述语音合成服务器转换所述第二文本文件后的音频码流文件。
5.根据权利要求4所述的连续长语音文件的翻译方法,其特征在于,所述解析所述音频码流文件,得到与所述各第一语音段和各第一非语音段分布次序相同的各第二语音段和各第二非语音段的步骤,包括:
将所述第一文本文件的第一字符串信息与所述第二文本文件的第二字符串信息对应分析,得到第一类一一对应关系;
通过语音活动检测分析技术处理所述音频码流文件,获得第二语音帧和第二非语音帧的排布状态;
根据所述第二语音帧和第二非语音帧的排布状态获得各第二语音段与各第二非语音段;
根据所述第一类一一对应关系建立各所述第一语音段与各所述第二语音段的第二类一一对应关系;
根据所述第二类一一对应关系,以及各第一语音段和各第一非语音段按照在所述连续长语音中生成的时序,获得与所述各第一语音段和各第一非语音段分布次序相同的各第二语音段和各第二非语音段。
6.一种翻译机,其特征在于,包括:
第一解析模块,用于解析连续长语音文件,得到各第一语音段和各第一非语音段,其中,各第一语音段和各第一非语音段按照在所述连续长语音中生成的时序分布;
发送接收模块,用于发送所述连续长语音文件至服务器进行翻译,并接收所述服务器翻译所述连续长语音文件后的音频码流文件;
第二解析模块,用于解析所述音频码流文件,得到与所述各第一语音段和各第一非语音段分布次序相同的各第二语音段和各第二非语音段;
替换模块,用于在所述音频码流文件中将相同排序位置的所述第一非语音段替换掉所述第二非语音段,得到最终的翻译语音文件。
7.根据权利要求6所述的翻译机,其特征在于,所述第一解析模块,包括:
第一处理单元,用于通过语音活动检测分析技术处理所述连续长语音文件,获得第一语音帧和第一非语音帧的排布状态;
第一获得单元,用于根据所述,获得第一语音帧和第一非语音帧的排布状态获得各第一语音段和各第一非语音段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市沃特沃德股份有限公司,未经深圳市沃特沃德股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711388000.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于深度神经网络的游戏翻译系统
- 下一篇:语音翻译方法和装置