[发明专利]视频处理方法和装置在审
| 申请号: | 202310081522.8 | 申请日: | 2023-01-30 |
| 公开(公告)号: | CN116112680A | 公开(公告)日: | 2023-05-12 |
| 发明(设计)人: | 张雅君;张鹏伟;邱慎杰 | 申请(专利权)人: | 上海哔哩哔哩科技有限公司 |
| 主分类号: | H04N19/40 | 分类号: | H04N19/40;H04N5/21 |
| 代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 王勇;邓小玲 |
| 地址: | 200433 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 视频 处理 方法 装置 | ||
1.一种视频处理方法,其特征在于,所述方法包括:
获取第一视频,所述第一视频包括有抖的低位深视频;
通过去抖模型将所述第一视频转换为第二视频,所述第二视频包括去抖的高位深视频,所述低位深视频的第一位深低于所述高位深视频的第二位深;其中,所述去抖模型包括训练好的深度神经网络模型,深度神经网络模型用于去抖和位深转换。
2.根据权利要求1所述的视频处理方法,其特征在于,所述方法还包括:
在获取到所述去抖模型的情形下,对所述去抖模型进行加速和优化,以得到目标格式文件;
将所述目标格式文件关联到推理机中,以便通过调用所述推理机运行所述去抖模型。
3.根据权利要求2所述的视频处理方法,其特征在于,所述方法还包括:
通过自定义滤镜的方式,封装关联有所述目标格式文件的推理机,以得到目标滤镜。
4.根据权利要求1至3任一项所述的视频处理方法,其特征在于,所述深度神经网络模型通过以下操作训练得到:
将样本输入画面输入到所述深度神经网络模型中,以得到预测画面;其中,所述样本输入画面为低位深有抖画面;
获取所述预测画面和样本参考画面之间像素的平均绝对误差;其中,所述样本参考画面为与所述样本输入画面对应的高位深无抖画面;
获取所述预测画面的全变分损失;
根据所述平均绝对差和所述全变分损失,对所述深度神经网络模型进行优化。
5.根据权利要求4所述的视频处理方法,其特征在于,所述方法还包括:
获取样本视频组,所述样本视频组包括同一视频对应的输入视频和参考视频,所述输入视频为有抖的低位深样本视频,所述参考视频为无抖的高位深样本视频;
以预设数量的帧画面间隔,从所述输入视频取得多个帧画面以得到多个低位深帧画面,以及从所述参考视频取得多个对应帧画面以得到对应的多个高位深帧画面;
在每个低位深帧画面中截取符合目标尺寸的图像画面,以得到多个所述样本输入画面;及
在每个高位深帧画面相应区域截取符合所述目标尺寸的图像画面,以得到多个所述样本参考画面。
6.根据权利要求4所述的视频处理方法,其特征在于,所述获取样本视频组包括:
获取多个所述样本视频组,其中,多个所述样本视频组对应的多个输入视频对应若干种抖色策略。
7.根据权利要求4所述的视频处理方法,其特征在于,所述获取样本视频组包括:
获取多个高位深样本视频,多个高位深样本视频对应若干种内容类型;
根据不同的抖色策略,将所述多个高位深样本视频转为有抖的低位深样本视频;及
根据所述多个高位深样本视频和所述多个低位深样本视频,得到多个所述样本视频组。
8.一种视频处理装置,其特征在于,所述装置包括:
获取模块,用于获取第一视频,所述第一视频包括有抖的低位深视频;
转换模块,用于通过去抖模型将所述第一视频转换为第二视频,所述第二视频包括去抖的高位深视频,所述低位深视频的第一位深低于所述高位深视频的第二位深;其中,所述去抖模型包括训练好的深度神经网络模型,深度神经网络模型用于去抖和位深转换。
9.一种计算机设备,其特征在于,包括:
至少一个处理器;及
与所述至少一个处理器通信连接的存储器;其中:
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机指令,所述计算机指令被处理器执行时实现如权利要求1至7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海哔哩哔哩科技有限公司,未经上海哔哩哔哩科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310081522.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:防摔保护壳
- 下一篇:一种封闭式自循环液态料饲喂系统





