[发明专利]媒体素材处理方法、装置、设备、服务器及存储介质有效
申请号: | 202010370079.2 | 申请日: | 2020-04-30 |
公开(公告)号: | CN111526405B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 郭燧冰;廖凯恩;朱康峰;张倩;刘柏;范长杰;李仁杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | H04N21/43 | 分类号: | H04N21/43;H04N21/8352;G06F16/48;G11B27/031 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 刘静 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 媒体 素材 处理 方法 装置 设备 服务器 存储 介质 | ||
本申请提供一种媒体素材处理方法、装置、设备、服务器及存储介质,涉及数据处理技术领域。该方法包括:在待标注媒体素材播放的过程中,获取通过预设标注界面输入的针对待标注媒体素材的标注信息,其中,待标注媒体素材包含视频轨道和音频轨道;根据标注信息,对待标注媒体素材进行标注。本申请提供的方法,可在对待标注媒体素材的视频轨道和音频轨道的时间轴进行对齐后,对视频轨道和音频轨道进行标注,可保证对视频轨道的标注信息与视频内容的匹配性,以有效提高标注结果的准确性。通过对音频轨道以及视频轨道进行混合标注,相比现有技术,单独对视频标注或单独对音频标注,标注结果可靠性更高,基于标注结果实现虚拟人物渲染,渲染效果更好。
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种媒体素材处理方法、装置、设备、服务器及存储介质。
背景技术
人工智能技术通常需要大量经过人工标注的媒体素材对模型进行训练。
现有技术中,通常是仅对视频进行标注,不关注音频,或者通过音频标注对视频进行辅助分析,或者仅仅对音频进行标注,并没有包含视频的信息。
但是,单纯的对视频进行标注或者对音频标注,当对视频的标注或者对音频的标注存在较大偏差时,将导致音视频同步效果较差,音视频匹配精确度较低。
发明内容
本发明的目的在于,针对上述现有技术中的不足,提供一种媒体素材处理方法、装置、设备、服务器及存储介质,以便于解决现有技术中存在的音视频不同步,匹配效果较差的问题。
为实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请实施例提供了一种媒体素材处理方法,所述方法包括:
在待标注媒体素材播放的过程中,获取通过预设标注界面输入的针对所述待标注媒体素材的标注信息,其中,所述待标注媒体素材包含视频轨道和音频轨道;
根据所述标注信息,对所述待标注媒体素材进行标注。
可选地,在对所述待标注媒体素材进行标注之前,所述方法包括:
将所述视频轨道和所述音频轨道的时间轴进行对齐,以获得所述待标注媒体素材。
可选地,所述将所述视频轨道和所述音频轨道的时间轴进行对齐,包括:
获取通过所述预设标注界面输入的所述视频轨道和所述音频轨道的时间轴移动操作;
响应所述时间轴移动操作,对所述视频轨道和所述视频轨道的时间轴进行对齐。
可选地,所述将所述视频轨道和所述音频轨道的时间轴进行对齐,包括:
对所述音频轨道和预设音频轨道的时间轴进行对齐,所述预设音频轨道为与所述视频轨道的时间轴对齐的音频轨道。
可选地,对所述音频轨道和预设音频轨道的时间轴进行对齐,包括:
检测所述音频轨道和所述预设音频轨道中是否均具有语音数据;
若所述音频轨道和所述预设音频轨道中均有语音数据,则分别对所述音频轨道和所述预设音频轨道进行语音转写处理;
根据所述语音转写处理的结果,分别确定所述音频轨道和所述预设音频轨道中第一条语音的开始时间;
根据所述音频轨道和所述预设音频轨道中第一条语音的开始时间,对所述音频轨道和所述预设音频轨道的时间轴进行对齐。
可选地,所述对所述音频轨道和预设音频轨道的时间轴进行对齐,包括:
若所述音频轨道和所述预设音频轨道中不具有语音数据,则根据所述音频轨道和所述预设音频轨道对应波形的振幅,对所述音频轨道和所述预设音频轨道的时间轴进行对齐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010370079.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:钼基高温合金的TLP焊接方法
- 下一篇:程序的升级方法、设备、系统和介质