[发明专利]基于深度学习的说话人计数方法、装置、设备及存储介质在审
申请号: | 202111023744.1 | 申请日: | 2021-09-01 |
公开(公告)号: | CN113903328A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 陈文明;陈新磊;张洁;张世明 | 申请(专利权)人: | 深圳壹秘科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/16;G10L25/30;G10L25/51 |
代理公司: | 深圳市恒程创新知识产权代理有限公司 44542 | 代理人: | 张小容 |
地址: | 518107 广东省深圳市光明区凤凰*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及深度学习技术领域,公开了一种基于深度学习的说话人计数方法、装置、设备及存储介质,所述方法包括:根据目标区域内多通道的时域语音信号得到对应的幅度谱信息和相位谱信息;根据幅度谱信息、相位谱信息以及预设帧序列长度信息生成对应的特征维度信息;根据预设卷积递归神经网络模型对特征维度信息进行预测;基于预测得到的语音信号概率分布信息确定目标区域内说话人数量;本发明通过预设卷积递归神经网络模型和特征维度信息得到语音信号概率分布信息,根据语音信号概率分布信息确定目标区域内说话人数量,以实现对目标区域内说话人的计数,相较于现有技术通过传统音频算法实现对说话人的计数,能够有效提高对说话人计数的准确率。 | ||
搜索关键词: | 基于 深度 学习 说话 计数 方法 装置 设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹秘科技有限公司,未经深圳壹秘科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111023744.1/,转载请声明来源钻瓜专利网。