[发明专利]基于深度学习的说话人计数方法、装置、设备及存储介质在审
申请号: | 202111023744.1 | 申请日: | 2021-09-01 |
公开(公告)号: | CN113903328A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 陈文明;陈新磊;张洁;张世明 | 申请(专利权)人: | 深圳壹秘科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/16;G10L25/30;G10L25/51 |
代理公司: | 深圳市恒程创新知识产权代理有限公司 44542 | 代理人: | 张小容 |
地址: | 518107 广东省深圳市光明区凤凰*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 说话 计数 方法 装置 设备 存储 介质 | ||
1.一种基于深度学习的说话人计数方法,其特征在于,所述基于深度学习的说话人计数方法包括以下步骤:
采集目标区域内多通道的时域语音信号,根据所述时域语音信号得到对应的幅度谱信息和相位谱信息;
根据所述幅度谱信息、相位谱信息以及预设帧序列长度信息生成对应的特征维度信息;
根据预设卷积递归神经网络模型对所述特征维度信息进行预测,得到语音信号概率分布信息;
基于所述语音信号概率分布信息确定所述目标区域内说话人数量,以实现对所述目标区域内说话人的计数。
2.如权利要求1所述的基于深度学习的说话人计数方法,其特征在于,所述采集目标区域内多通道的时域语音信号,根据所述时域语音信号得到对应的幅度谱信息和相位谱信息,包括:
采集目标区域内多通道的时域语音信号;
对所述时域语音信号进行分帧;
对分帧后的时域语音信号进行傅里叶变换;
根据预设采样规则和傅里叶变换后的时域语音信号得到目标频域信息;
根据所述目标频域信息确定对应的幅度谱信息和相位谱信息。
3.如权利要求1所述的基于深度学习的说话人计数方法,其特征在于,所述根据所述幅度谱信息、相位谱信息以及预设帧序列长度信息生成对应的特征维度信息,包括:
获取目标采集设备的数量信息;
根据所述数量信息确定所述幅度谱信息的通道占据信息;
根据所述数量信息确定所述相位谱信息的通道占据信息;
获取预设连续帧序列信息,根据所述预设连续帧序列信息得到预设帧序列长度信息;
基于所述幅度谱信息的通道占据信息、所述相位谱信息的通道占据信息以及所述预设帧序列长度信息生成对应的特征维度信息。
4.如权利要求3所述的基于深度学习的说话人计数方法,其特征在于,所述获取预设连续帧序列信息,根据所述预设连续帧序列信息得到预设帧序列长度信息,包括:
获取预设卷积递归神经网络模型中所支持的目标说话人数量;
根据所述目标说话人数量得到对应的类别信息;
根据预设向量标签信息和所述类别信息确定标签向量的格式信息;
根据预设语音检测策略和所述标签向量的格式信息对时域语音信号进行检测,得到语音帧信息和非语音帧信息;
获取预设连续帧序列信息,根据所述预设连续帧序列信息、语音帧信息和非语音帧信息得到预设帧序列长度信息。
5.如权利要求1所述的基于深度学习的说话人计数方法,其特征在于,所述根据预设卷积递归神经网络模型对所述特征维度信息进行预测,得到语音信号概率分布信息,包括:
提取所述预设卷积递归神经网络模型中的卷积神经网络信息和循环递归神经网络信息;
根据所述卷积神经网络信息对所述特征维度信息进行卷积;
根据所述循环递归神经网络信息对卷积后的特征维度信息进行预测,得到语音信号概率分布信息。
6.如权利要求5所述的基于深度学习的说话人计数方法,其特征在于,所述根据所述循环递归神经网络信息对卷积后的特征维度信息进行预测,得到语音信号概率分布信息,包括:
提取所述循环递归神经网络信息中的长短期记忆循环神经网络信息;
根据所述长短期记忆循环神经网络信息确定目标预测策略;
根据所述卷积后的特征维度信息确定对应的特征维度时序序列;
基于所述目标预测策略对所述特征维度时序序列进行预测,得到语音信号概率分布信息。
7.如权利要求1至6中任一项所述的基于深度学习的说话人计数方法,其特征在于,所述基于所述语音信号概率分布信息确定所述目标区域内说话人数量,包括:
对所述语音信息概率分布信息对应的语音信号概率进行排序;
根据排序后的语音信号概率得到目标概率值;
基于所述目标概率值的的下标确定所述目标区域内说话人数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹秘科技有限公司,未经深圳壹秘科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111023744.1/1.html,转载请声明来源钻瓜专利网。