[发明专利]一种语音数据处理方法及装置有效

申请号：	201910161760.3	申请日：	2019-03-04
公开（公告）号：	CN109712626B	公开（公告）日：	2021-04-30
发明（设计）人：	张明远	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L21/0216
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	郝传鑫;熊永强
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音数据处理方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种语音数据处理方法及装置，所述方法包括：响应针对麦克风阵列的第一触发操作；所述麦克风阵列包括多个分别指向对应方向的第一麦克风集合，每个第一麦克风集合均与第一语音拾取模式相关联；激活所述第一触发操作相关联的至少一个第一麦克风集合，将激活的第一麦克风集合确定为工作麦克风集合，根据所述工作麦克风集合所指向的方向确定目标方向范围；通过所述第一语音拾取模式和所述工作麦克风集合，对所述目标方向范围内的语音信号进行语音拾取，生成第一目标语音信号。采用本发明实施例，可以降低语音数据采集过程中的噪声干扰，进而提高语音识别的准确率。

技术领域

本发明涉及拾音技术领域，尤其涉及一种语音数据处理方法及装置。

背景技术

在语音处理领域，智能设备(如智能音箱、智能电视等)的不断普及，对语音处理领域中的麦克风阵列技术提出了更高的要求。

在目前的会议系统中，为了记录会议中所有发言人的语音数据，可以通过全向拾音设备采集各个方向上说话人的语音数据，并对采集到的全方向上的语音数据进行语音处理。可见，在语音数据处理过程中，采集全方向上的语音数据容易造成较大的噪声干扰，比如在会议发言人说话的过程中存在其余人的说话声音，导致拾音设备采集到了除发言人对应的语音数据之外的其余语音数据(即噪声)，进而导致语音识别的准确率低下。

发明内容

本发明实施例提供一种语音数据处理方法和装置，可以降低语音数据采集过程中的噪声干扰，进而提高语音识别的准确率。

本发明一方面提供了一种语音数据处理方法，包括：

响应针对麦克风阵列的第一触发操作；所述麦克风阵列包括多个分别指向对应方向的第一麦克风集合，每个第一麦克风集合均与第一语音拾取模式相关联；

激活与所述第一触发操作相关联的至少一个第一麦克风集合，将激活的第一麦克风集合确定为工作麦克风集合，根据所述工作麦克风集合所指向的方向确定目标方向范围；

通过所述第一语音拾取模式和所述工作麦克风集合，对所述目标方向范围内的语音信号进行语音拾取，生成第一目标语音信号。

其中，所述激活与所述第一触发操作相关联的至少一个第一麦克风集合，将激活的第一麦克风集合确定为工作麦克风集合，根据所述工作麦克风集合所指向的方向确定目标方向范围，包括：

当所述第一触发操作关联至少两个第一麦克风集合时，激活所述至少两个第一麦克风集合，将激活的第一麦克风集合确定为工作麦克风集合；

获取每个工作麦克风集合分别指向的方向的第一角度信息；

若每相邻两个工作麦克风集合之间的夹角均小于或等于角度阈值，则将所述第一角度信息中最小的角度信息与最大的角度信息之间的角度范围确定为目标方向范围。

其中，所述通过所述第一语音拾取模式和所述工作麦克风集合，对所述目标方向范围内的语音信号进行语音拾取，生成第一目标语音信号，包括：

通过所述第一语音拾取模式和所述至少两个第一麦克风集合，生成每个第一麦克风集合分别对应的语音增益信号；所述语音增益信号为所述每个第一麦克风集合基于所述目标方向范围内的语音信号生成的；