[发明专利]音频分段方法、装置、存储介质及电子设备在审
| 申请号: | 202010613730.4 | 申请日: | 2020-06-30 |
| 公开(公告)号: | CN111782863A | 公开(公告)日: | 2020-10-16 |
| 发明(设计)人: | 王征韬 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
| 主分类号: | G06F16/65 | 分类号: | G06F16/65;G06F16/683;G06N3/04;G06N3/08;G06F17/14 |
| 代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 李汉亮 |
| 地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 分段 方法 装置 存储 介质 电子设备 | ||
1.一种音频分段方法,其特征在于,包括:
将目标音频划分为多个音频片段,并提取每个音频片段的音频特征;
根据预设特征提取算法从对应的音频特征中,提取每一音频片段的第一特征向量;
将所述第一特征向量输入预设分类模型,以确定每一音频片段的初始段落类型;
将各个音频片段的初始段落类型输入至时序相关损失函数层,以使所述时序相关损失函数层基于各个音频片段之间的时序关系,确定各个音频片段的目标段落类型;
根据每一音频片段的目标段落类型,确定所述目标音频包括的段落类型和每个段落类型对应的段落的起止时间。
2.如权利要求1所述的音频分段方法,其特征在于,所述将所述目标音频划分为多个音频片段,并提取每个音频片段的音频特征,包括:
对所述目标音频进行短时傅里叶变换,得到频域信号;
对所述频域信号进行梅尔尺度变换,得到所述目标音频对应的梅尔频谱特征;
按照预设区间和预设步长将所述目标音频分割为多个音频片段,并根据所述梅尔频谱特征确定每个音频片段的音频特征。
3.如权利要求1所述的音频分段方法,其特征在于,将所述第一特征向量输入预设分类模型,以确定每一音频片段的初始段落类型,包括:
基于全局特征提取网络对所述第一特征向量进行全局特征提取处理,得到每一音频片段对应的第二特征向量;
将所述第二特征向量输入预设分类模型,以确定每一音频片段的初始段落类型。
4.如权利要求1至3任意一项所述的音频分段方法,其特征在于,所述根据预设特征提取算法从对应的音频特征中,提取每一音频片段的第一特征向量,包括:
将所述多个音频片段的音频特征输入预设的音频分段模型,以使所述音频分段模型包括的卷积神经网络分别对每一所述音频片段进行卷积运算,得到每一所述音频片段对应的特征张量;
对每一所述音频片段对应的所述特征张量进行降维处理,得到每一所述音频片段对应的第一特征向量。
5.如权利要求4所述的音频分段方法,其特征在于,所述音频分段模型还包括全局池化层;所述对每一所述音频片段对应的所述特征张量进行降维处理,得到每一所述音频片段对应的第一特征向量,包括:
根据所述全局池化层对每一所述音频片段对应的所述特征张量进行降维处理,得到每一所述音频片段对应的第一特征向量。
6.如权利要求1所述的音频分段方法,其特征在于,所述根据每一音频片段的目标段落类型,确定所述目标音频包括的段落类型和每个段落类型对应的段落的起止时间,包括:
获取每一音频片段对应的目标段落标签,所述目标段落标签用于表征目标段落类型;
将相邻的音频片段的目标段落标签,进行同类合并处理;
根据同类合并处理的结果确定所述目标音频包括的段落类型和每个段落类型对应的段落的起止时间。
7.如权利要求6所述的音频分段方法,其特征在于,所述将相邻的音频片段的目标段落标签,进行同类合并处理之前,还包括:
去掉多个所述目标段落标签中的无效标签,并对剩余的目标段落标签件进行中值滤波,以删除异常段落标签;
对经过中值滤波处理后剩余的目标段落标签,将相邻的音频片段的目标段落标签进行同类合并处理。
8.如权利要求6所述的音频分段方法,其特征在于,根据同类合并处理的结果确定所述目标音频包括的段落类型和每个段落类型对应的段落的起止时间,包括:
根据同类合并处理的结果,将具有相同目标段落标签的连续多个音频片段作为一个段落,将所述相同目标段落标签作为所述段落的段落标签;
确定每一段落的起始音频片段和终止音频片段;
将所述起始音频片段的起始时间作为所述段落的起始时间,将所述终止音频片段的终止时间作为所述段落的终止时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010613730.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:全自动中药材初加工生产线及其使用方法
- 下一篇:一种路由处理方法及装置





