[发明专利]一种基于人工智能的语音翻译系统在审
申请号: | 202111199680.0 | 申请日: | 2021-10-14 |
公开(公告)号: | CN113919375A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 林永超 | 申请(专利权)人: | 河源市忆源电子科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G10L15/26;G10L13/08 |
代理公司: | 北京高航知识产权代理有限公司 11530 | 代理人: | 刘艳玲 |
地址: | 517500 广东省河源市东源县蝴蝶岭工业城广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 语音 翻译 系统 | ||
本发明提供一种基于人工智能的语音翻译系统,包括:语言选择模块用于获取第一语言选择指令和第二语言选择指令;语音采集模块用于采集待翻译的第一语音信号;语音识别模块用于根据第一语言选择指令调用对应的语音识别引擎对第一语音信号进行识别处理,获取第一文本信息;语音翻译模块用于根据获取的第二语言选择指令,调用对应的文本翻译引擎对第一文本信息进行翻译处理得到第二文本信息;语音合成模块用于根据获取的第二语言选择指令,调用对应的语音合成引擎对第二文本信息进行处理,得到第二语音信号。本发明能够适应不同场景下用户对语音进行翻译并直接输出翻译语音的需求,方便用户使用。
技术领域
本发明涉及语音处理技术领域,特别是一种基于人工智能的语音翻译系统。
背景技术
目前,当人们在旅游、商务沟通等场景下,特别是针对不懂外语或者外语不好的用户,当需要和使用不同语言的外国人进行交流的时候,通常会借助手机翻译软件来协助沟通。现有技术中,大多的翻译软件仅能够实现文本信息的翻译,例如是在软件中输入中文的文本信息,由翻译软件翻译成指定的语言(例如是英文)的文本进行显示,再由用户将屏幕给对方查看,以使得能够将需要表达的意思传达给对方,当上述通过文本传递的方式,在实际操作过程中需要来回输入以及查看屏幕,存在使用不方便和适应性不高的问题。
发明内容
针对上述提出的现有的翻译软件,通过文本信息进行翻译意思传达的方式存在使用不方便和适应性不高的技术问题,本发明旨在提供一种基于人工智能的语音翻译系统。
本发明的目的采用以下技术方案来实现:
本发明示出一种基于人工智能的语音翻译系统,包括:语言选择模块、语音采集模块、语音识别模块、语音翻译模块、语音合成模块和输出模块;其中,
语言选择模块用于获取第一语言选择指令和第二语言选择指令;
语音采集模块用于采集待翻译的第一语音信号,并将第一语音信号传输到语音识别模块;
语音识别模块用于根据第一语言选择指令调用对应的语音识别引擎对第一语音信号进行识别处理,获取第一语音信号的第一文本信息;
语音翻译模块用于根据获取的第二语言选择指令,调用对应的文本翻译引擎对第一文本信息进行翻译处理得到第二文本信息;
语音合成模块用于根据获取的第二语言选择指令,调用对应的语音合成引擎对第二文本信息进行处理,根据第二文本信息中匹配各文本对应的文本语音,并将文本语音进行合成,得到与第二文本信息对应的第二语音信号;
输出模块用于分别输出第一文本信息、第二文本信息和第二语音信号。
一种实施方式中,该系统还包括数据库模块,数据库模块用于存储至少一个语音识别引擎、至少一个文本翻译引擎和至少一个语音合成引擎的相关数据,分别供语音识别模块、语音翻译模块和语音合成模块调用。
一种实施方式中,语言选择模块包括第一语言选择单元和第二语言选择单元;其中,
第一语言选择单元用于供用户选择第一语言,根据用户选择的第一语言生成第一语言选择指令;
第二语言选择单元用于供用户选择第二语言,根据用户选择的第二语言生成第二语言选择指令。
一种实施方式中,语音采集模块包括第一接收单元和传输单元;
第一接收单元与用户终端连接,用于接收由用户终端传输的第一语音信号;
传输单元用于将获取的第一语音信号传输到语音识别模块。
一种实施方式中,语音识别模块包括预处理单元、有声部分提取单元、特征提取单元和识别引擎单元;
预处理单元,用于对获取的第一语音信号进行解码、降噪等处理,得到预处理后的第一语音信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河源市忆源电子科技有限公司,未经河源市忆源电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111199680.0/2.html,转载请声明来源钻瓜专利网。