[发明专利]一种分段式混合视频和音频同步的方法和装置在审
申请号: | 201980039051.6 | 申请日: | 2019-08-13 |
公开(公告)号: | CN112567721A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 赵杰 | 申请(专利权)人: | 视频本地化公司 |
主分类号: | H04N5/04 | 分类号: | H04N5/04;H04N21/80;H04N21/2368 |
代理公司: | 东莞市卓越超群知识产权代理事务所(特殊普通合伙) 44462 | 代理人: | 李慧 |
地址: | 加拿大安大略省多伦*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 段式 混合 视频 音频 同步 方法 装置 | ||
1.一种分段式混合视频和音频同步的方法,其特征在于,包括:确定相同数量的阈值,每个通道一个;
标识每个通道内除起点外按时间顺序编制索引的多个控制点,其中一个通道内的某个控制点上的内容将基于数据内容与每个其他通道内具有相同索引的控制点上的内容同步;
使用每个通道的控制点将其分割为相同数量的分段片段,以便每个片段的起点和终点都在某个控制点,第一个片段除外,该片段始于起点并终于第一个控制点;
应用第一种算法来确定相同数量的目标长度,所有通道中具有相同索引的所有片段确定一个目标长度且每个片段确定一组参数;
应用第二种算法,以使用片段的一组参数修改每个片段的数据来匹配目标长度;
通过按顺序连接经过修改的片段来重新生成每个通道;
其中,在媒体播放期间,任何通道内各控制点上的内容都与所有其他通道内各控制点上的内容同时出现;
其中所有通道内任意位置的内容在感官上已同步;其中经过修改的通道和输入通道之间的感知质量差异在阈值范围内。
2.如权利要求1所述的一种分段式混合视频和音频同步的方法,其特征在于,其中第一算法基于包含机器学习、人工智能预测模型和神经网络的方法,或基于针对优化问题的解决方案。
3.如权利要求1所述的一种分段式混合视频和音频同步的方法,其特征在于,其中第二算法为线性或非线性媒体数据转换方法。
4.如权利要求1所述的一种分段式混合视频和音频同步的方法,其特征在于,其中输入数据由对媒体流文件进行解码获得,且解码生成的媒体数据编码为另一媒体流文件。
5.如权利要求1所述的一种分段式混合视频和音频同步的方法,其特征在于,其中全部处理操作自动完成。
6.如权利要求1所述的一种分段式混合视频和音频同步的方法,其特征在于,其中至少一个生成的通道通过混合至少两个同步通道获得。
7.如权利要求1所述的一种分段式混合视频和音频同步的方法,其特征在于,其中通过人工选择、场记板或其他AV交互方法来搜索和确定控制点。
8.如权利要求1所述的一种分段式混合视频和音频同步的方法,其特征在于,其中通道之一为视频,另一通道为音频。
9.如权利要求8所述的一种分段式混合视频和音频同步的方法,其特征在于,其中第二算法包括插值、
抽取或重新采样视频帧,以及更改样本音频的音调、节拍或速度。
10.如权利要求8所述的一种分段式混合视频和音频同步的方法,其特征在于,其中视频保持不变,修改音频以在时间上匹配视频。
11.如权利要求8所述的一种分段式混合视频和音频同步的方法,其特征在于,其中音频保持不变,修改视频以在时间上匹配音频。
12.如权利要求8所述的一种分段式混合视频和音频同步的方法,其特征在于,其中修改视频和音频以匹配时间长度不同的视频和音频。
13.如权利要求8所述的一种分段式混合视频和音频同步的方法,其特征在于,其中修改至少一个视频片段以匹配音频片段,并修改至少一个音频片段以匹配视频片段。
14.如权利要求1所述的一种分段式混合视频和音频同步的方法,其特征在于,其中存在至少一个不能
在阈值范围内同步的片段,因此,如果原始长度比目标长度长,则将截断;如果原始长度比目标长度短,则将填充空白。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于视频本地化公司,未经视频本地化公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980039051.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多光谱分析系统的校准
- 下一篇:预旋流压力雾化尖端