[发明专利]基于人工智能的语音翻译方法、装置、终端设备和云端服务器在审

申请号：	201710183965.2	申请日：	2017-03-24
公开（公告）号：	CN106935240A	公开（公告）日：	2017-07-07
发明（设计）人：	周奇;刁伟卓;徐鸣	申请（专利权）人：	百度在线网络技术（北京）有限公司
主分类号：	G10L15/00	分类号：	G10L15/00;G10L15/26;G10L15/30;G10L25/51;G06F17/28
代理公司：	北京清亦华知识产权代理事务所(普通合伙)11201	代理人：	宋合成
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于人工智能语音翻译方法装置终端设备云端服务器
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本申请涉及语音处理技术领域，尤其涉及一种基于人工智能的语音翻译方法、装置、终端设备和云端服务器。

背景技术

目前在出境游市场，翻译软件基本基于手机端，虽然可以解决一些场景的语言交流难题，但由于在境外使用场景时，语言翻译准确度低，而且出行时地图和/或拍照等应用(Application；以下简称：APP)使用的粘性更高，翻译APP由于需要切换APP调用，在即时性满足上有缺陷。同时，越来越多的中老年出游人群，对于手机软件使用教育成本较高，对于“傻瓜型”即按即用的翻译机存在强烈需求。

但是现有的翻译类硬件产品，基本是电子词典的变型，多为文字查询，语音实时翻译的产品很少，并且准确率较低。另外，现有的翻译类硬件产品多是解决语言学习需求，对于出境游场景的翻译支持度不高，翻译准确率较低。

发明内容

本申请的目的旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本申请的第一个目的在于提出一种基于人工智能的语音翻译方法。该方法可以实现语音的实时翻译，满足出境游场景的翻译需求，并且翻译准确率较高。

本申请的第二个目的在于提出一种基于人工智能的语音翻译装置。

本申请的第三个目的在于提出一种终端设备。

本申请的第四个目的在于提出一种云端服务器。

本申请的第五个目的在于提出一种包含计算机可执行指令的存储介质。

为了实现上述目的，本申请第一方面实施例的基于人工智能的语音翻译方法，包括：接收用户通过终端设备输入的源语种的语音；将所述源语种的语音发送至云端服务器；接收所述云端服务器发送的目标语种的音频文件，所述目标语种的音频文件是所述云端服务器对所述源语种的语音进行语音识别，确定将所述源语种的语音翻译为至少两种目标语种中除所述源语种之外的至少一种目标语种之后，将语音识别获得的文本翻译成确定的目标语种的文本，以及对翻译成的目标语种的文本进行语音合成后获得的；播放所述目标语种的音频文件。

本申请实施例的基于人工智能的语音翻译方法中，接收用户通过终端设备输入的源语种的语音之后，将上述源语种的语音发送至云端服务器，然后接收上述云端服务器发送的目标语种的音频文件，最后播放上述目标语种的音频文件，从而可以实现语音的实时翻译，满足出境游场景的翻译需求，并且翻译准确率较高。

为了实现上述目的，本申请第二方面实施例的基于人工智能的语音翻译方法，包括：接收终端设备发送的源语种的语音；对所述源语种的语音进行语音识别，将所述源语种的语音转化为源语种的文本；确定将所述源语种的语音翻译为至少两种目标语种中除所述源语种之外的至少一种目标语种；将所述源语种的文本翻译成确定的目标语种的文本，对翻译成的目标语种的文本进行语音合成，获得目标语种的音频文件；将所述目标语种的音频文件发送给所述终端设备，以供所述终端设备播放。

本申请实施例的基于人工智能的语音翻译方法中，接收终端设备发送的源语种的语音之后，对上述源语种的语音进行语音识别，将上述源语种的语音转化为源语种的文本，在确定将上述源语种的语音翻译为至少两种目标语种中除上述源语种之外的至少一种目标语种之后，将上述源语种的文本翻译成确定的目标语种的文本，并对翻译成的目标语种的文本进行语音合成，获得目标语种的音频文件，最后将上述目标语种的音频文件发送给上述终端设备，以供上述终端设备播放，从而可以实现语音的实时翻译，满足出境游场景的翻译需求，并且翻译准确率较高。

为了实现上述目的，本申请第三方面实施例的基于人工智能的语音翻译装置，设置在终端设备上，所述基于人工智能的语音翻译装置包括：接收模块，用于接收用户通过终端设备输入的源语种的语音；发送模块，用于将所述源语种的语音发送至云端服务器；所述接收模块，还用于接收所述云端服务器发送的目标语种的音频文件，所述目标语种的音频文件是所述云端服务器对所述源语种的语音进行语音识别，确定将所述源语种的语音翻译为至少两种目标语种中除所述源语种之外的至少一种目标语种之后，将语音识别获得的文本翻译成确定的目标语种的文本，以及对翻译成的目标语种的文本进行语音合成后获得的；播放模块，用于播放所述目标语种的音频文件。

本申请实施例的基于人工智能的语音翻译装置中，接收模块接收用户通过终端设备输入的源语种的语音之后，发送模块将上述源语种的语音发送至云端服务器，然后接收模块接收上述云端服务器发送的目标语种的音频文件，最后播放模块播放上述目标语种的音频文件，从而可以实现语音的实时翻译，满足出境游场景的翻译需求，并且翻译准确率较高。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于百度在线网络技术（北京）有限公司，未经百度在线网络技术（北京）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710183965.2/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于人工智能的语音翻译方法、装置、终端设备和云端服务器在审

专利文献下载