[发明专利]一种说话人角色识别模型、方法、装置及存储介质在审

申请号：	202011471497.7	申请日：	2020-12-11
公开（公告）号：	CN114627883A	公开（公告）日：	2022-06-14
发明（设计）人：	龚科;郑国林	申请（专利权）人：	暗物智能科技(广州)有限公司
主分类号：	G10L17/06	分类号：	G10L17/06;G10L17/18
代理公司：	北京三聚阳光知识产权代理有限公司 11250	代理人：	李红团
地址：	511400 广东省广州市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种说话人角色识别模型、方法、装置及存储介质，该模型包括：依次连接多个残差层，每个残差层包括依次连接的深度可分离卷积层、批归一化层、激活函数层以及标准卷积层，残差层用于对待识别音频进行特征提取；全局平均池化层，用于接收残差层输出的数据进行统一；全连接层，用于接收所述全局平均池化层输出的数据进行分类，确定音频属于对应说话人角色的概率。通过实施本发明，在模型中设置残差层、全局平均池化层以及全连接层，可以实现对音频的说话人角色识别分类，解决了现有技术中无法实现说话人角色识别的技术问题。
搜索关键词：	一种说话角色识别模型方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于暗物智能科技(广州)有限公司，未经暗物智能科技(广州)有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202011471497.7/，转载请声明来源钻瓜专利网。

专利分类

免登录下载普通用户下载升级VIP会员，免费下载

专利文献下载