[发明专利]一种说话人角色识别模型、方法、装置及存储介质在审
申请号: | 202011471497.7 | 申请日: | 2020-12-11 |
公开(公告)号: | CN114627883A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 龚科;郑国林 | 申请(专利权)人: | 暗物智能科技(广州)有限公司 |
主分类号: | G10L17/06 | 分类号: | G10L17/06;G10L17/18 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 李红团 |
地址: | 511400 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种说话人角色识别模型、方法、装置及存储介质,该模型包括:依次连接多个残差层,每个残差层包括依次连接的深度可分离卷积层、批归一化层、激活函数层以及标准卷积层,残差层用于对待识别音频进行特征提取;全局平均池化层,用于接收残差层输出的数据进行统一;全连接层,用于接收所述全局平均池化层输出的数据进行分类,确定音频属于对应说话人角色的概率。通过实施本发明,在模型中设置残差层、全局平均池化层以及全连接层,可以实现对音频的说话人角色识别分类,解决了现有技术中无法实现说话人角色识别的技术问题。 | ||
搜索关键词: | 一种 说话 角色 识别 模型 方法 装置 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暗物智能科技(广州)有限公司,未经暗物智能科技(广州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011471497.7/,转载请声明来源钻瓜专利网。