[发明专利]基于深度学习的同期声识别方法有效
申请号: | 202011492040.4 | 申请日: | 2020-12-17 |
公开(公告)号: | CN112233667B | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 陈锋;温序铭;罗明利;杨瀚;谢超平 | 申请(专利权)人: | 成都索贝数码科技股份有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L17/04;G06N3/08;G06N3/04;G06K9/62;G06K9/00 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 贾年龙 |
地址: | 610041 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于深度学习的同期声识别方法,包括步骤:S1,获取新闻节目视频,利用视频转场将获取的新闻节目视频分割为多个片段,抽取音频,然后对音频打上同期声或非同期声的标记;S2,提取音频特征;S3,利用步骤S2中处理后的数据基于深度学习网络模型进行训练,并与预训练模型结合进行迁移学习训练,获得分类预测模型,作为同期声识别模型;S4,对同期声识别模型的结果进行融合输出等;本发明减小了同期声识别中的计算资源消耗,提高了可靠性和稳定性,提高了同期声识别质量和工作效率,增强了节目内容的感染力和节目制作效率等。 | ||
搜索关键词: | 基于 深度 学习 同期 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都索贝数码科技股份有限公司,未经成都索贝数码科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011492040.4/,转载请声明来源钻瓜专利网。