[发明专利]两级语音对齐方法、电子设备,及存储介质在审
申请号: | 202210274508.5 | 申请日: | 2022-03-18 |
公开(公告)号: | CN114882904A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 陈运兵;张新科;崔潇潇 | 申请(专利权)人: | 北京探境科技有限公司 |
主分类号: | G10L25/27 | 分类号: | G10L25/27;G10L25/48 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 刘静 |
地址: | 100094 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例涉及一种两级语音对齐方法、电子设备,及存储介质,包括:获取语音数据,以及字级抄本;将二者输入字级对齐模型,获取初始字级对齐结果;遍历每一帧字级帧数据,对属于同一字的相邻帧进行合并,获取第一合并帧数据,记录其起始时间和结束时间;将第一类占位符与与第一类占位符紧邻的字对应的字级帧数据合并,获取第二合并帧数据;更新其起始时间和结束时间,获取字级对齐抄本;获取第一频谱特征序列和信息向量;将二者和字级对齐抄本输入音素级对齐模型,获取初始音素级对齐结果;遍历每一帧音素级帧数据,将第二类占位符与音素单元对应的音素级帧数据合并,获取音素级对齐抄本。以上,不会在抄本开始位置或结束位置出现错误。 | ||
搜索关键词: | 两级 语音 对齐 方法 电子设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京探境科技有限公司,未经北京探境科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210274508.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于音乐的蕾丝面料的加工方法
- 下一篇:一种填充剂等量匀速推进套筒