[发明专利]一种长语音标注装置及方法有效

专利信息
申请号: 201911018547.3 申请日: 2019-10-24
公开(公告)号: CN110738986B 公开(公告)日: 2022-08-05
发明(设计)人: 王丽媛;齐红威;王大亮;张云斌;何鸿凌 申请(专利权)人: 数据堂(北京)智能科技有限公司
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06;G10L25/24;G10L25/30;G10L25/78;G10L25/87
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 林哲生
地址: 100190 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种长语音标注装置及方法,以对长语音进行标注得到有效语音段落。在本发明实施例中,对长语音进行预处理得到语音信号后,会使用初始标注网络对语音帧进行初始标注,得到初始标注结果,再使用标注修正网络以模拟人工纠错的行为对初始标注结果进行修正(修正类型体现了对初始标注结果所进行的修正),在一定程度上减少了标注误差,然后再由标注决策子单元决策每一语音帧的最终标注结果(有效语音帧或无效语音帧)。由于有效语音段落包括连接多个有效语音帧,因此,在确定每一语音帧是有效语音帧或无效语音帧后,有效语音段落也会确定下来,从而实现了对长语音的标注。
搜索关键词: 一种 语音 标注 装置 方法
【主权项】:
1.一种长语音标注装置,其特征在于,用于在训练阶段及预测阶段标定长语音中的有效语音段落;/n所述装置包括预处理单元、特征提取单元和标注单元;/n其中,所述预处理单元用于:对输入的长语音进行预处理,得到多个语音信号;所述语音信号包含至少多帧语音帧;所述预处理包括等时长截断和预加重;/n所述特征提取单元用于:对所述语音信号进行特征提取,得到语音帧特征;/n所述标注单元包括:初始标注网络子单元、标注修正网络子单元和标注决策子单元;其中:/n所述初始标注网络子单元用于:根据所述语音帧特征对所述语音信号中的语音帧进行标注,得到每一语音帧的初始标注结果;/n所述标注修正网络子单元用于:根据所述初始标注结果与所述语音帧特征,得到与所述语音帧的初始标注结果相对应的修正类型;/n所述标注决策子单元用于:至少根据所述初始标注结果与所述修正类型,决策得到每一语音帧的最终标注结果;其中,所述最终标注结果用于表征相应的语音帧为有效语音帧或无效语音帧;有效语音段落包括连续多个有效语音帧。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于数据堂(北京)智能科技有限公司,未经数据堂(北京)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201911018547.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top