[发明专利]音频信息处理方法、智能终端及语音控制终端在审
申请号: | 201710102948.1 | 申请日: | 2017-02-23 |
公开(公告)号: | CN106856093A | 公开(公告)日: | 2017-06-16 |
发明(设计)人: | 匡涛;任晓楠;崔保磊 | 申请(专利权)人: | 海信集团有限公司 |
主分类号: | G10L19/005 | 分类号: | G10L19/005;G10L15/22 |
代理公司: | 北京三高永信知识产权代理有限责任公司11138 | 代理人: | 江崇玉 |
地址: | 266071 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信息处理 方法 智能 终端 语音 控制 | ||
技术领域
本发明实施例涉及终端技术领域,特别涉及一种音频信息处理方法、智能终端及语音控制终端。
背景技术
随着终端技术的发展,诸如智能电视机、智能空调等智能终端已渐渐成为人们生活中必不可少的工具,且为了方便用户的生活,用户通常会通过语音控制终端对智能终端进行控制。其中,语音控制终端可以通过蓝牙与智能终端进行连接,而语音控制终端对智能终端进行控制的关键为:智能终端对语音控制终端发送的音频信息进行处理。
当用户通过语音控制终端控制智能终端时,该语音控制终端可以对用户输入的语音进行采集,得到音频数据,并将该音频数据进行压缩得到包括多个语音压缩包的音频信息。语音控制终端将该音频信息包括的多个语音压缩包基于蓝牙传输协议发送至智能终端,当该智能终端接收到该音频信息的多个语音压缩包时,可以对该多个语音压缩包进行解压并进行语音识别,从而基于语音识别后得到的信息对该智能终端进行控制。比如,该语音控制终端可以为语音遥控器,该智能终端可以为智能电视机,该语音遥控器可以对用户输入的语音进行采集,得到的音频数据为包括“打开家庭娱乐”这一信息的数据,该语音遥控器可以将该音频数据进行压缩得到包括多个语音压缩包的音频信息,将该音频信息基于蓝牙传输协议发送至该智能电视机。当该智能电视机接收到该音频信息时,可以对该音频信息进行解压并进行语音识别,得到“打开家庭娱乐”的信息,该智能电视机可以基于该信息运行家庭娱乐。
但是通常情况下,为了使智能终端可以实现更多的功能,该智能终端除了通过蓝牙与语音控制终端连接,还会通过WIFI(Wireless Fidelity,无线保真)等方式进行网络连接,因此,智能终端中会使用蓝牙模块和WIFI模块公用的技术。但由于该蓝牙模块产生的蓝牙信号,以及WIFI模块产生的WIFI信号在信息传输过程中使用相同频段,使得用户通过语音控制终端控制智能终端时,该WIFI信号会对蓝牙信号造成干扰,导致智能终端在接收语音控制终端发送的音频信息时,该音频信息中出现语音压缩包丢失现象。此外,当该音频信息中丢失的语音压缩包较多时,智能终端可能无法识别出该音频信息,从而降低智能终端对音频信息进行语音识别的正确率,导致无法进行控制操作。
发明内容
为了提高智能终端对音频信息进行语音识别的正确率,本发明实施例提供了一种音频信息处理方法、智能终端及语音控制终端。所述技术方案如下:
第一方面,提供了一种基于蓝牙传输协议的音频信息处理方法,应用于智能终端中,所述方法包括:
接收语音控制终端发送的音频信息,所述音频信息包括至少两个语音压缩包和每个语音压缩包对应的语音压缩包标识;
基于所述语音压缩包标识确定所述音频信息中是否丢失语音压缩包;
当所述音频信息中丢失语音压缩包时,基于与丢失的语音压缩包相邻的语音压缩包的发音信息,在丢失语音压缩包的位置处添加语音补偿信息,得到优化音频信息,所述语音补偿信息为能够与所述相邻的至少一个语音压缩包的发音信息实现平滑过渡的音频信息;
对所述优化音频信息进行语音识别。
可选地,所述基于所述语音压缩包标识确定所述音频信息中是否丢失语音压缩包,包括:
将所述语音压缩包标识按照大小顺序进行排序;
判断排序后的语音压缩包标识是否符合指定规则,所述指定规则用于描述所述语音压缩包标识的排序结果;
当所述排序后的语音压缩包标识符合所述指定规则时,确定所述音频信息未丢失语音压缩包;
当所述排序后的语音压缩包标识不符合所述指定规则时,确定所述音频信息丢失语音压缩包。
可选地,所述当所述音频信息中丢失语音压缩包时,基于与所述丢失的语音压缩包相邻的至少一个语音压缩包的发音信息,在丢失语音压缩包的位置处添加语音补偿信息,得到优化音频信息,包括:
将所述语音压缩包标识中不符合所述指定规则的相邻两个语音压缩包标识之间的位置,确定为所述音频信息中丢失语音压缩包的位置;
在对所述音频信息进行解压后,确定与所述丢失的语音压缩包前后相邻的两个语音压缩包分别对应的第一发音信息和第二发音信息;
基于所述第一发音信息和所述第二发音信息中的至少一个发音信息,在丢失语音压缩包的位置处添加所述语音补偿信息,得到所述优化音频信息,所述语音补偿信息能够与所述第一发音信息和所述第二发音信息中的至少一个发音信息实现平滑过渡。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信集团有限公司,未经海信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710102948.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于胆甾相液晶显示装置的扫描驱动方法
- 下一篇:环绕式直播立体声方法