[发明专利]一种语音交互方法、装置和智能终端有效
申请号: | 201780003279.0 | 申请日: | 2017-12-27 |
公开(公告)号: | CN108369805B | 公开(公告)日: | 2019-08-13 |
发明(设计)人: | 张含波 | 申请(专利权)人: | 深圳前海达闼云端智能科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L13/033;G10L21/034 |
代理公司: | 深圳市爱迪森知识产权代理事务所(普通合伙) 44341 | 代理人: | 何婷 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应答语音 语音交互 主频率 交互环境 噪声频率 噪声信息 噪声音量 智能终端 合成 指令 播放音量 动态调整 掩蔽效应 音量播放 音量 播放 检测 | ||
1.一种语音交互方法,应用于智能终端,其特征在于,包括:
当接收到语音交互指令时,检测当前交互环境的噪声信息,所述噪声信息包括噪声音量和噪声频率;
根据所述噪声频率确定用于合成与所述语音交互指令对应的应答语音的主频率;
基于所述主频率合成所述应答语音;
根据所述噪声音量、所述噪声频率和所述应答语音的主频率确定播放所述应答语音的音量;
以所确定的所述音量播放所述应答语音。
2.根据权利要求1所述的语音交互方法,其特征在于,所述根据所述噪声频率确定用于合成与所述语音交互指令对应的应答语音的主频率,包括:
确定所述噪声频率所处的临界频带;
根据所述临界频带确定用于合成与所述语音交互指令对应的应答语音的主频率。
3.根据权利要求1所述的语音交互方法,其特征在于,所述根据所述噪声音量、所述噪声频率和所述应答语音的主频率确定播放所述应答语音的音量,包括:
根据所述噪声频率和所述应答语音的主频率确定掩蔽量;
根据所述噪声音量和所述掩蔽量确定播放所述应答语音的音量。
4.根据权利要求3所述的语音交互方法,其特征在于,所述根据所述噪声频率和所述应答语音的主频率确定掩蔽量,包括:
如果所述噪声频率低于所述应答语音的主频率,则确定所述掩蔽量为第一掩蔽量;
如果所述噪声频率高于所述应答语音的主频率,则确定所述掩蔽量为第二掩蔽量;
所述第一掩蔽量大于所述第二掩蔽量。
5.根据权利要求1-4任一项所述的语音交互方法,其特征在于,所述以所确定的所述音量播放所述应答语音的步骤之后,还包括:
获取交互体验反馈信息;
根据所述交互体验反馈信息调整播放所述应答语音的音量。
6.根据权利要求1-4任一项所述的语音交互方法,其特征在于,当所述语音交互指令由语音控制信息触发时,所述以所确定的所述音量播放所述应答语音,包括:
获取接收到基于所述语音控制信息触发的所述语音交互指令的时间节点;
在间隔所述时间节点预设时长后,以所确定的所述音量播放所述应答语音。
7.一种语音交互装置,运行于智能终端,其特征在于,包括:
噪声检测单元,用于当接收到语音交互指令时,检测当前交互环境的噪声信息,所述噪声信息包括噪声音量和噪声频率;
主频率确定单元,用于根据所述噪声频率确定用于合成与所述语音交互指令对应的应答语音的主频率;
语音合成单元,用于基于所述主频率合成所述应答语音;
音量确定单元,用于根据所述噪声音量、所述噪声频率和所述应答语音的主频率确定播放所述应答语音的音量;
播放单元,用于以所确定的所述音量播放所述应答语音。
8.根据权利要求7所述的语音交互装置,其特征在于,所述主频率确定单元具体用于:
确定所述噪声频率所处的临界频带;
根据所述临界频带确定用于合成与所述语音交互指令对应的应答语音的主频率。
9.根据权利要求7所述的语音交互装置,其特征在于,所述音量确定单元,包括:
掩蔽量确定模块,用于根据所述噪声频率和所述应答语音的主频率确定掩蔽量;
音量确定模块,用于根据所述噪声音量和所述掩蔽量确定播放所述应答语音的音量。
10.根据权利要求9所述的语音交互装置,其特征在于,所述掩蔽量确定模块具体用于:
如果所述噪声频率低于所述应答语音的主频率,则确定所述掩蔽量为第一掩蔽量;
如果所述噪声频率高于所述应答语音的主频率,则确定所述掩蔽量为第二掩蔽量;
所述第一掩蔽量大于所述第二掩蔽量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海达闼云端智能科技有限公司,未经深圳前海达闼云端智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780003279.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音交互设备和语音交互方法
- 下一篇:可配置的通用语言理解模型