[发明专利]一种多声道虚拟声像音视频在线检测方法及装置有效

专利信息
申请号: 201811266490.4 申请日: 2018-10-29
公开(公告)号: CN109089112B 公开(公告)日: 2019-12-27
发明(设计)人: 牛欢;孟子厚;高靖;甄茹 申请(专利权)人: 中国传媒大学
主分类号: H04N17/00 分类号: H04N17/00
代理公司: 32231 常州佰业腾飞专利代理事务所(普通合伙) 代理人: 顾翰林
地址: 100024 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种多声道虚拟声像音视频在线检测方法及装置,其中方法包括:获取影视作品多轨音视频,提取多轨音频文件和多帧视频文件;从多轨音频文件中提取声音特征参数,并根据声音特征参数获取非运动声源信号以及运动声源信号;对运动声源信号利用各通道运动声源的声音特征参数进行匹配,标记运动声源的水平运动轨迹以及运动声源的起始运动时间;利用运动声源的起始运动时间以及多帧视频文件通过基于区域的多类目标识别与分割算法进行计算,追踪目标声源,并计算运动声源的垂直上下空间的运动轨迹;在多轨音频文件中添加运动声源的标注文件。
搜索关键词: 运动声源 多轨 声音特征参数 音频文件 音视频 声源 多帧视频 起始运动 虚拟声像 在线检测 多声道 水平运动轨迹 标记运动 标注文件 多类目标 分割算法 计算运动 目标声源 上下空间 通道运动 信号利用 影视作品 运动轨迹 匹配 垂直 追踪
【主权项】:
1.一种多声道虚拟声像音视频在线检测方法,其特征在于,包括:/n获取影视作品多轨音视频,提取多轨音频文件和多帧视频文件;/n从所述多轨音频文件中提取声音特征参数,并根据所述声音特征参数获取非运动声源信号以及运动声源信号;/n对所述运动声源信号利用各通道运动声源的声音特征参数进行匹配,标记运动声源的水平运动轨迹以及运动声源的起始运动时间;/n利用所述运动声源的起始运动时间以及所述多帧视频文件通过基于区域的多类目标识别与分割算法进行计算,追踪目标声源,并计算运动声源的垂直上下空间的运动轨迹;/n利用所述运动声源的水平运动轨迹、所述运动声源的起始运动时间以及所述运动声源的垂直上下空间的运动轨迹在所述多轨音频文件中添加运动声源的标注文件。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811266490.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top