[发明专利]一种信息处理方法及相关设备在审
申请号: | 202111562845.6 | 申请日: | 2021-12-20 |
公开(公告)号: | CN114242108A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 王武城 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/78;G10H1/00 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 陈梅君 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 相关 设备 | ||
1.一种生成音文时间戳的方法,其特征在于,所述方法包括:
利用对齐模型对音频信号和所述音频信号对应的文本内容进行处理,获得音文时间戳,所述音文时间戳包括所述音频信号在所述文本内容中对应的每个字的起始时间和结束时间;
利用人声检测模型确定所述音频信号中人声与非人声之间的跳变点;
根据所述音频信号中人声与非人声之间的跳变点对所述音文时间戳进行调整,获得调整后的音文时间戳。
2.根据权利要求1所述的方法,其特征在于,所述人声检测模型是利用第一梅尔频率倒谱系数MFCC特征和第二MFCC特征训练获得的,所述第一MFCC特征是从人声音频中提取的,所述第二MFCC是从非人声音频中提取的。
3.根据权利要求1所述的方法,其特征在于,所述利用人声检测模型确定所述音频信号中人声与非人声之间的跳变点,包括:
对所述音频信号进行划分,获得N帧音频;
根据所述人声检测模型对所述音频信号进行检测,获得检测结果;所述检测结果包括所述N帧音频中的每一帧音频属于人声或非人声音频的结果;
根据所述检测结果,确定所述音频信号中人声与非人声之间的跳变点,所述人声与非人声之间的跳变点包括人声转非人声的跳变点以及非人声转人声的跳变点。
4.根据权利要求3所述的方法,其特征在于,所述根据所述人声检测模型对所述音频信号进行检测,获得检测结果,包括:
针对所述N帧音频中的每帧音频,利用所述人声检测模型计算该帧音频是人声的最大似然概率值,以及该帧音频是非人声的最大似然概率值;
若该帧音频是人声的最大似然概率值大于该帧音频是非人声的最大似然概率值,确定该帧音频是人声帧;
若该帧音频是人声的最大似然概率值小于该帧音频是非人声的最大似然概率值,确定该帧音频是非人声帧。
5.根据权利要求3或4所述的方法,其特征在于,所述根据所述音频信号中人声与非人声之间的跳变点对所述音文时间戳进行调整,获得调整后的音文时间戳,包括:
根据人声转非人声的跳变点,调整所述音文时间戳中所述人声的结束时间和/或所述非人声的起始时间,以获得调整后的音文时间戳。
6.根据权利要求3或4所述的方法,其特征在于,所述根据所述音频信号中人声与非人声之间的跳变点对所述音文时间戳进行调整,获得调整后的音文时间戳,还包括:
根据非人声转人声的跳变点,调整所述音文时间戳中所述非人声的结束时间和/或所述人声的起始时间,以获得调整后的音文时间戳。
7.根据权利要求1所述的方法,其特征在于,所述利用对齐模型对音频信号和所述音频信号对应的文本内容进行处理,获得音文时间戳,包括:
从音频信号中提取第三MFCC特征;
对所述音频信号对应的文本内容进行内容转换处理,得到隐马尔可夫模型HMM状态序列;
将所述第三MFCC特征和所述HMM状态序列输入到对齐模型,获得音文时间戳。
8.根据权利要求7所述的方法,其特征在于,所述将所述第三MFCC特征和所述HMM状态序列输入到对齐模型,获得音文时间戳,包括:
利用对齐模型计算所述第三MFCC特征中每一帧特征对应的隐马尔可夫状态的概率值;
根据所述每一帧特征对应的隐马尔可夫状态的概率值,得到所述第三MFCC特征对应的所述HMM状态序列;
将所述HMM状态序列进行内容转换,得到音文时间戳。
9.一种信息处理设备,其特征在于,所述信息处理设备还包括:
存储器、处理器,其中,所述存储器上存储有信息处理程序,所述信息处理程序被所述处理器执行时实现如权利要求1至8中任一项所述的信息处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的信息处理方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111562845.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:检测仪器信息显示方法、电子设备及可读存储介质
- 下一篇:一种干粉气溶胶发生器