[发明专利]在多相机/麦克风系统中应用风格转移函数的系统和方法在审
申请号: | 202211407871.6 | 申请日: | 2022-11-10 |
公开(公告)号: | CN116347250A | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 斯坦利·巴兰;查鲁·斯里瓦斯塔瓦;斯里坎特·波特尔斯;迈克尔·罗森茨维格;阿奇·沙玛 | 申请(专利权)人: | 英特尔公司 |
主分类号: | H04N23/95 | 分类号: | H04N23/95;H04N23/90;G06T5/00;H04R1/40;H04R29/00;H04R3/00;H04S7/00 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 张敏 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多相 麦克风 系统 应用 风格 转移 函数 方法 | ||
1.一种多相机风格转移系统,包括:
至少一个存储器;
所述系统中的指令;以及
处理器电路,用于执行所述指令以至少执行以下操作:
将风格转移函数应用于来自第二视频馈送的第二图像以基于参考图像生成风格化图像,所述参考图像对应于来自第一视频馈送的第一图像,所述第一视频馈送来自第一相机,所述第二视频馈送来自第二相机;
基于所述风格化图像来调整视频过滤器的一个或多个参数设置;并且
使用具有调整后的参数设置的视频过滤器来过滤所述第二视频馈送以生成所述第二视频馈送的过滤后版本。
2.根据权利要求1所述的多相机风格转移系统,其中,所述风格转移函数是逼真风格转移函数。
3.根据权利要求1所述的多相机风格转移系统,其中,所述风格转移函数是机器学习模型。
4.根据权利要求3所述的多相机风格转移系统,其中,所述风格转移函数是神经网络(NN)风格转移函数。
5.根据权利要求1所述的多相机风格转移系统,其中,所述参数设置对应于视觉特性,所述视觉特性包括以下各项中的至少一者:色温、色调、曝光、白平衡、色相、饱和度、或者亮度。
6.根据权利要求1所述的多相机风格转移系统,其中,所述处理器电路通过以下操作来调整所述视频过滤器的一个或多个参数设置:
使用具有第一参数设置的视频过滤器来过滤所述第二图像以生成过滤后图像;并且
应用损失函数,以用于:
确定所述风格化图像和所述过滤后图像之间的差异;并且
基于所述风格化图像和所述过滤后图像之间的差异来将所述第一参数设置改变到第二参数设置。
7.根据权利要求1所述的多相机风格转移系统,其中,所述处理器电路确定是否要更新所述参考图像。
8.根据权利要求7所述的多相机风格转移系统,其中,所述处理器电路基于参数与阈值的比较来确定是否要更新所述参考图像。
9.根据权利要求8所述的多相机风格转移系统,其中,所述参数包括以下各项中的至少一者:时间限制、来自所述第一视频馈送的当前图像和所述参考图像之间的差异、或者所述第一视频馈送中的场景变化。
10.根据权利要求1-9中任一项所述的多相机风格转移系统,其中,所述处理器电路用于:
识别所述参考图像中的第一片段;
识别所述第二图像中的第二片段;
将所述风格转移函数应用于所述第二图像中的第二片段以生成所述风格化图像;
基于所述风格化图像来调整所述视频过滤器的一个或多个参数设置;并且
使用具有调整后的参数设置的视频过滤器来过滤所述第二视频馈送中的对应片段。
11.一种非暂时性计算机可读存储介质,包括指令,所述指令在被执行时,使得至少一个处理器至少执行以下操作:
将风格转移函数应用于来自第二视频馈送的第二图像以基于参考图像生成风格化图像,所述参考图像对应于来自第一视频馈送的第一图像,所述第一视频馈送来自第一相机,所述第二视频馈送来自第二相机;
基于所述风格化图像来调整视频过滤器的一个或多个参数设置;并且
使用具有调整后的参数设置的视频过滤器来过滤所述第二视频馈送以生成所述第二视频馈送的过滤后版本。
12.根据权利要求11所述的非暂时性计算机可读存储介质,其中,所述风格转移函数是逼真风格转移函数。
13.根据权利要求11所述的非暂时性计算机可读存储介质,其中,所述风格转移函数是机器学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211407871.6/1.html,转载请声明来源钻瓜专利网。