[发明专利]视频的处理方法及装置、处理器及电子设备在审
申请号: | 202011280358.6 | 申请日: | 2020-11-16 |
公开(公告)号: | CN114513615A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 王彬;朱圣晨;潘攀 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04N5/265 | 分类号: | H04N5/265;H04N21/232;H04N21/234;H04N21/2368;H04N21/432;H04N21/439;H04N21/44 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 谢湘宁;张文华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 处理 方法 装置 处理器 电子设备 | ||
1.一种视频的处理方法,其特征在于,包括:
获取播放画面中展示的待处理视频的视频内容;
在所述播放画面中展示与所述视频内容匹配的多个音乐数据,其中,基于从所述视频内容中识别到的视觉特征确定匹配的至少一个听觉特征,所述听觉特征用于确定所述音乐数据;
从多个所述音乐数据中选取目标音乐数据;
将所述目标音乐数据与所述视频内容合成得到目标视频。
2.根据权利要求1所述的方法,其特征在于,在所述播放画面中展示与所述视频内容匹配的多个音乐数据,包括:
获取音乐数据库中的听觉特征集合;
基于识别到的所述视觉特征从所述听觉特征集合中进行匹配,确定与所述视频内容匹配的至少一个所述听觉特征;
基于所述听觉特征,生成允许播放的多个所述音乐数据;
在所述播放画面中展示多个所述音乐数据。
3.根据权利要求1所述的方法,其特征在于,在所述播放画面中展示与所述视频内容匹配的多个音乐数据,包括:
确定与所述视觉特征匹配的至少一个听觉特征;
从音乐数据库中提取与所述听觉特征对应的多个所述音乐数据;
在所述播放画面中展示多个所述音乐数据。
4.根据权利要求1所述的方法,其特征在于,从多个所述音乐数据中选取目标音乐数据,包括:
确定多个所述音乐数据与所述视频内容的匹配等级;
基于所述匹配等级对多个所述音乐数据进行排序,得到排序结果;
从所述排序结果中选取第一匹配等级的音乐数据,作为所述目标音乐数据。
5.根据权利要求4所述的方法,其特征在于,确定多个所述音乐数据与所述视频内容的匹配等级,包括:
获取多个所述音乐数据的听觉特征和所述视频内容的视觉特征;
确定所述听觉特征与所述视觉特征之间的语义关联程度;
基于所述语义关联程度确定所述匹配等级。
6.根据权利要求1所述的方法,其特征在于,从多个所述音乐数据中选取目标音乐数据,包括:
响应于用户控制指令,从多个所述音乐数据中选取所述目标音乐数据。
7.根据权利要求1所述的方法,其特征在于,从多个所述音乐数据中选取目标音乐数据,包括:
从多个所述音乐数据中随机选取所述音乐数据,作为所述目标音乐数据。
8.根据权利要求1所述的方法,其特征在于,将所述目标音乐数据与所述视频内容合成得到目标视频,包括:
确定所述视频内容的视频时长;
依据所述视频时长,对所述目标音乐数据和所述视频内容进行对齐处理;
基于对齐处理结果对所述目标音乐数据和所述视频内容进行合成处理,得到所述目标视频。
9.根据权利要求1所述的方法,其特征在于,在将所述目标音乐数据与所述视频内容合成得到目标视频之后,所述方法还包括:
发布所述目标视频;
获取已发布目标视频的反馈结果,其中,所述反馈结果包括以下至少之一:播放量、停留量以及转换率;
基于所述反馈结果从所述已发布目标视频中选取回流视频,其中,所述回流视频用于优化视频的处理模型。
10.一种视频的处理方法,其特征在于,包括:
获取待处理视频的视频内容;
识别出所述视频内容中包括的至少一个视觉特征;
获取与所述视觉特征匹配的听觉特征,其中,一个视觉特征至少对应一个听觉特征;
将获取到的至少一个所述听觉特征进行融合,生成多个音乐数据;
从多个所述音乐数据中选取目标音乐数据;
将所述目标音乐数据与所述视频内容合成,得到目标视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011280358.6/1.html,转载请声明来源钻瓜专利网。