[发明专利]一种语音分类模型的构建方法及装置有效
申请号: | 201710388497.2 | 申请日: | 2017-05-27 |
公开(公告)号: | CN107452371B | 公开(公告)日: | 2019-03-05 |
发明(设计)人: | 姜东;赵彦宾;侯爽;夏绪宏;李磊;洪定坤 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08;G10L25/57 |
代理公司: | 北京金言诚信知识产权代理有限公司 11229 | 代理人: | 余先同 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 分类 模型 构建 方法 装置 | ||
本发明公开一种语音分类模型的构建方法及装置,所述方法包括:根据预先定义的正常音频数据集和广告音频数据集获取相应的正常音频信号特征和广告音频信号特征;将所述正常音频信号特征和所述广告音频信号特征作为样本数据输入到分类器中;对所述分类器中的所述样本数据进行训练,获得训练的所述样本数据中用于分割所述正常音频信号特征和所述广告音频信号特征的超平面。通过采用本发明提供的分类模型可以准确识别出广告语音位置,大幅提升视频审核效率,降低审核人力成本。
技术领域
本发明涉及互联网技术领域,具体涉及一种语音分类模型的构建方法及装置。
背景技术
随着web2.0及web3.0版本的兴起与潮流导向,社交媒体平台变成了网民更喜爱的聚集地,因为这里不但可以看到自己感兴趣的东西,更可以分享自己的成果和心情,在这种互联网环境的发展趋势下,逐渐诞生UGC、PGC、OGC等概念。
UGC(User-generated Content)用户生产内容,也称UCC(User-createdContent)。随着移动互联网的发展,网上内容的创作又被细分出PGC (Professionally-generated Content)专业生产内容,也称PPC (Professionally-produced Content)和OGC(Occupationally-generated Content) 职业生产内容。
其中,通过PGC和UGC用户上传视频已经成为当前视频网站内容生产的主要方式,对于短视频平台,这类内容可占比90%以上。一些PGC,UGC内容生产者为扩大品牌影响力,经常在其视频中夹带各种广告,以广告语音,视频广告为主要表现形式。若不采取措施全部放出这类视频,会严重影响用户体验,造成投诉量大增。由于每日新上传视频数量大(高峰时50万+),若全部以人工审核方式排查广告需耗费大量的人力和时间,并大幅增加视频从上传到放出展示的时间,从而明显提升运营成本。
现有技术中通常是通过语音识别出文字,然后通过关键词匹配是否有广告内容出现,进而识别广告内容,该方法存在两方面的缺陷:
一方面,受限于语音识别的准确性;
另一方面,受限于关键词的覆盖面,在作弊者稍微变换花样后便很难准确识别。
因此,如何提供一种有效的识别出视频中广告语音的分类模型,对于大型视频网站提高审核效率降低运营成本具有十分重要的意义。
发明内容
本发明提供一种语音分类模型的构建方法及装置,以解决现有技术中分类模型存在广告语音识别准确性低的问题。
本发明提供一种语音分类模型的构建方法,包括:
根据预先标记的正常音频数据集和广告音频数据集获取相应的正常音频信号特征和广告音频信号特征;
将所述正常音频信号特征和所述广告音频信号特征作为训练数据输入到分类器中;
对所述分类器中的所述训练数据进行训练,获取所述训练数据中用于分割所述正常音频信号特征和所述广告音频信号特征的超平面。
优选的,包括:记录所述正常音频信号特征和/或所述广告音频信号特征到所述超平面的平均距离。
优选的,所述根据预先标记的正常音频数据集和广告音频数据集获取相应的正常音频信号特征和广告音频信号特征,包括:
对所述预先标记的正常音频数据集和广告音频数据集进行静音预处理。
优选的,所述对所述预先标记的正常音频数据集和广告音频数据集进行静音预处理,包括:
统计并删除预先标记的所述正常音频数据集和所述广告音频数据集中语音能量低于整段待识别视音频数据平均值10%的音频数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710388497.2/2.html,转载请声明来源钻瓜专利网。