[发明专利]利用语者识别的切割音视讯片段的方法有效
申请号: | 201410001020.0 | 申请日: | 2014-01-02 |
公开(公告)号: | CN103730111B | 公开(公告)日: | 2016-11-30 |
发明(设计)人: | 王惇琳;刘继谥;林志荣 | 申请(专利权)人: | 中华电信股份有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;H04N21/845 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 王茹;曾旻辉 |
地址: | 中国台湾桃*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的利用语者识别的切割音视讯片段的方法,以递增的未知语者来源音讯即时训练非特定语者模型,并利用语者识别的结果决定音视讯片段,包含下列步骤:(1)即时训练非特定语者模型;(2)依据该语者模型决定来源音讯非特定语者片段;(3)依来源音讯非特定语者片段更新语者模型。本发明提出语者模型即时累进训练方法,即时撷取非特定语者特征音讯讯号,快速学习强健性语者音讯模型,解决即时训练无法取得语者音讯讯号问题,克服无法取得足够训练模型样本问题。本发明通过即时训练语者模型,可利用即时训练的特性用于侦测不特定语者及其对应的音视讯片段,提升语者侦测技术的实用性。 | ||
搜索关键词: | 利用 识别 切割 视讯 片段 方法 | ||
【主权项】:
一种利用语者识别的切割音视讯片段的方法,其特征在于,是以递增的未知语者来源音讯即时训练非特定语者模型,并利用语者识别的结果决定音视讯片段,步骤如下:A.即时训练非特定语者模型;即时训练非特定语者模型为由来源音讯中撷取一段固定时间长度的语者音讯讯号;B.依据该语者模型决定来源音讯非特定语者片段;以及C.依来源音讯非特定语者片段更新语者模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中华电信股份有限公司,未经中华电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410001020.0/,转载请声明来源钻瓜专利网。