[发明专利]语音芯片和电子设备在审
申请号: | 202010090986.1 | 申请日: | 2020-02-13 |
公开(公告)号: | CN111292716A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 严小平;田超 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L15/06;G10L15/26 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 芯片 电子设备 | ||
本申请公开了一种语音芯片和电子设备,涉及数据处理技术领域,尤其涉及语音技术。具体该芯片包括:第一处理模块、第二处理模块和第三处理模块;其中,所述第一处理模块用于运行操作系统,以及对芯片中除所述第一处理模块之外的其他模块进行数据调度;所述第二处理模块用于基于语音模型进行语音和文本的相互转换;所述第三处理模块用于对输入语音进行数字信号处理。本申请实施例提供一种语音芯片和电子设备,以使得智能语音产品支持离线场景的应用。
技术领域
本申请实施例涉及数据处理技术领域,尤其涉及语音技术。具体地,本申请实施例提供一种语音芯片和电子设备。
背景技术
当前应用于智能语音产品中的语音芯片主要包括:CPU、音频引擎和外设。其原理为:通过外设采集语音信号,音频引擎对采集的语音信号进行预处理,CPU将预处理后的语音信号发送给远端服务器,由远端服务器进行识别和响应,CPU接收响应语音,并控制外设将响应语音播报给用户。
上述方案存在如下缺陷:
语音识别功能完全依赖远端服务器,不支持离线场景的应用。
发明内容
本申请实施例提供一种语音芯片和电子设备,以使得智能语音产品支持离线场景的应用。
本申请实施例提供了一种语音芯片,该芯片包括:第一处理模块、第二处理模块和第三处理模块;
其中,所述第一处理模块用于运行操作系统,以及对芯片中除所述第一处理模块之外的其他模块进行数据调度;
所述第二处理模块用于基于语音模型进行语音和文本的相互转换;
所述第三处理模块用于对输入语音进行数字信号处理。
本申请实施例的技术方案,通过在语音芯片中增设第二处理模块,实现基于语音模型对输入语音或输入文本进行语音和文本的相互转换,然后由第一处理模块基于转换结果响应用户,从而使得应用该语音芯片的智能语音产品支持离线场景的应用。
此外,基于第二处理模块实现的文本到语音的转换,本申请实施例使得语音芯片可以实现文本转语音的相关应用。
进一步地,所述第二处理模块包括第二处理器和内部存储器;
所述第二处理器用于基于所述语音模型进行语音和文本的相互转换;
所述内部存储器,与所述第二处理器连接,用于对所述语音模型的执行过程中的数据进行存储。
基于该技术特征,本申请实施例通过在芯片中增设内部存储器,以对语音模型执行过程中的数据进行存储,从而辅助语音模型的执行,提高语音模型的执行效率。
进一步地,所述第二处理模块根据模型数据对所述语音模型的配置信息进行设置,以初始化所述语音模型,所述模型数据由所述第一处理模块通过外设接口从外部存储设备中获得。
基于该技术特征,本申请实施例通过第一处理模块经外部接口从外部存储设备中获取模型数据;由第二处理模块根据获取的模型数据对语音模型的配置信息进行设置,以实现语音模型的初始化。此外,通过修改模型数据还可以实现对语音模型的更新。
进一步地,所述芯片还包括外部存储模块,与所述第二处理模块连接,用于存储所述模型数据。
基于该技术特征,本申请实施例通过在芯片中增设外部存储模块,以实现对模型数据的存储,进而实现对模型数据的加载。
进一步地,所述第二处理器为嵌入式神经网络处理器。
进一步地,所述第三处理模块,对输入语音进行数字信号处理;
所述第三处理模块将处理得到的语音信号或语音特征数据发送给所述第二处理模块,由所述第二处理模块基于所述语音模型,对输入语音进行识别;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010090986.1/2.html,转载请声明来源钻瓜专利网。