[发明专利]一种长语音标注装置及方法有效
申请号: | 201911018547.3 | 申请日: | 2019-10-24 |
公开(公告)号: | CN110738986B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 王丽媛;齐红威;王大亮;张云斌;何鸿凌 | 申请(专利权)人: | 数据堂(北京)智能科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L25/24;G10L25/30;G10L25/78;G10L25/87 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 林哲生 |
地址: | 100190 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种长语音标注装置及方法,以对长语音进行标注得到有效语音段落。在本发明实施例中,对长语音进行预处理得到语音信号后,会使用初始标注网络对语音帧进行初始标注,得到初始标注结果,再使用标注修正网络以模拟人工纠错的行为对初始标注结果进行修正(修正类型体现了对初始标注结果所进行的修正),在一定程度上减少了标注误差,然后再由标注决策子单元决策每一语音帧的最终标注结果(有效语音帧或无效语音帧)。由于有效语音段落包括连接多个有效语音帧,因此,在确定每一语音帧是有效语音帧或无效语音帧后,有效语音段落也会确定下来,从而实现了对长语音的标注。 | ||
搜索关键词: | 一种 语音 标注 装置 方法 | ||
【主权项】:
1.一种长语音标注装置,其特征在于,用于在训练阶段及预测阶段标定长语音中的有效语音段落;/n所述装置包括预处理单元、特征提取单元和标注单元;/n其中,所述预处理单元用于:对输入的长语音进行预处理,得到多个语音信号;所述语音信号包含至少多帧语音帧;所述预处理包括等时长截断和预加重;/n所述特征提取单元用于:对所述语音信号进行特征提取,得到语音帧特征;/n所述标注单元包括:初始标注网络子单元、标注修正网络子单元和标注决策子单元;其中:/n所述初始标注网络子单元用于:根据所述语音帧特征对所述语音信号中的语音帧进行标注,得到每一语音帧的初始标注结果;/n所述标注修正网络子单元用于:根据所述初始标注结果与所述语音帧特征,得到与所述语音帧的初始标注结果相对应的修正类型;/n所述标注决策子单元用于:至少根据所述初始标注结果与所述修正类型,决策得到每一语音帧的最终标注结果;其中,所述最终标注结果用于表征相应的语音帧为有效语音帧或无效语音帧;有效语音段落包括连续多个有效语音帧。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于数据堂(北京)智能科技有限公司,未经数据堂(北京)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911018547.3/,转载请声明来源钻瓜专利网。