[发明专利]语音控制方法、装置、设备及存储介质在审

专利信息
申请号: 202110654493.0 申请日: 2021-06-11
公开(公告)号: CN113380249A 公开(公告)日: 2021-09-10
发明(设计)人: 任承明;常乐;陈孝良 申请(专利权)人: 北京声智科技有限公司
主分类号: G10L15/22 分类号: G10L15/22;G10L15/26;G10L17/00;G10L13/02;G10L21/0208
代理公司: 北京三高永信知识产权代理有限责任公司 11138 代理人: 邢少真
地址: 100094 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 控制 方法 装置 设备 存储 介质
【说明书】:

本申请提供了一种语音控制方法、装置、设备及存储介质,属于计算机技术领域。该方法包括:基于第一协议将目标应用的第一音频传输至耳机,耳机用于播放第一音频;接收耳机基于第二协议传输的第二音频,第二音频是耳机在播放第一音频的同时采集的;对第二音频进行语音识别,得到语音控制指令;根据语音控制指令,对目标应用进行控制。上述方案提供了一种新的目标应用,该目标应用在播放音频的同时,还能够支持语音控制功能。其中第一音频和第二音频分别通过两种协议在目标应用与耳机之间传输,两个音频之间的传输不会相互影响,这样在第一音频的播放音质不受影响的情况下,还能够通过音质良好的第二音频实现语音控制,保证语音控制的准确性。

技术领域

本申请涉及计算机技术领域,特别涉及一种语音控制方法、装置、设备及存储介质。

背景技术

日常生活中,用户常常需要控制目标应用执行一些操作。一般情况下,用户会通过手动触发的方式来控制目标应用,但随着自然语言处理技术的发展,如今用户无需手动触发,只需要通过语音就可控制目标应用执行一些操作。然而,目标应用能够实现的语音控制功能较为局限。

发明内容

本申请实施例提供了一种语音控制方法、装置、设备及存储介质,能够增强目标应用的语音控制功能,使得目标应用在播放音频的情况下,支持语音控制功能。所述技术方案如下:

一方面,提供了一种语音控制方法,所述方法包括:基于第一协议将目标应用的第一音频传输至所连接的耳机,所述耳机用于播放所述第一音频;接收所述耳机基于第二协议传输的第二音频,所述第二音频是所述耳机在播放所述第一音频的同时采集的;对所述第二音频进行语音识别,得到语音控制指令;根据所述语音控制指令,对所述目标应用进行控制。

在一种可能的实现方式中,所述方法由电子设备执行,所述基于第一协议将目标应用的第一音频传输至所连接的耳机,包括:基于所述第一协议,建立所述电子设备与所述耳机间的第一通信链路;通过所述目标应用,基于所述第一协议对所述第一音频进行处理,得到所述第一音频对应的数据包,并基于所述第一通信链路,将所述数据包传输至所述耳机。

在一种可能的实现方式中,所述方法由电子设备执行,所述接收所述耳机基于第二协议传输的第二音频,包括:基于所述第二协议,建立所述电子设备与所述耳机间的第二通信链路;接收所述耳机基于所述第二通信链路传输的数据包,并传输至所述目标应用,所述数据包由所述耳机基于所述第二协议,对所述第二音频处理得到。

在一种可能的实现方式中,所述对所述第二音频进行语音识别,得到语音控制指令,包括:将所述第二音频的音量调整至目标音量范围内;对音量调整后的所述第二音频进行语音识别,得到所述语音控制指令。

在一种可能的实现方式中,所述对所述第二音频进行语音识别,得到语音控制指令,包括:提取所述第二音频的声纹信息;将所述声纹信息与声纹库中的声纹信息进行比对,所述声纹库用于存储具有所述目标应用的语音控制权限的声纹信息;在所述声纹库包括所述第二音频的声纹信息的前提下,对所述第二音频进行语音识别,得到所述语音控制指令。

在一种可能的实现方式中,所述对所述第二音频进行语音识别,得到语音控制指令,包括:对所述第二音频进行语音识别,得到所述第二音频对应的文本;从所述文本中提取所述语音控制指令。

在一种可能的实现方式中,所述根据所述语音控制指令,对所述目标应用进行控制,包括:响应于所述语音控制指令为弹幕发布指令,从所述文本中提取位于所述弹幕发布指令之后的目标文本;在所述第一音频对应的音频播放界面中发布弹幕,所述弹幕包括所述目标文本。

在一种可能的实现方式中,所述在所述第一音频对应的音频播放界面中发布弹幕之后,所述方法还包括:显示包括所述弹幕的所述音频播放界面。

在一种可能的实现方式中,所述根据所述语音控制指令,对所述目标应用进行控制,包括:响应于所述语音控制指令为音频切换指令,控制所述目标应用切换所述第一音频。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110654493.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top