[发明专利]视频通话的处理方法和系统在审
申请号: | 202210344525.1 | 申请日: | 2022-03-31 |
公开(公告)号: | CN114845077A | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 金凌琳;余锋;王力 | 申请(专利权)人: | 当趣网络科技(杭州)有限公司 |
主分类号: | H04N7/14 | 分类号: | H04N7/14;H04N21/44;H04N21/4402 |
代理公司: | 杭州创智卓英知识产权代理事务所(普通合伙) 33324 | 代理人: | 刘宏全 |
地址: | 310051 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 通话 处理 方法 系统 | ||
1.一种视频通话的处理方法,其特征在于,所述方法包括:
获取视频帧以及所述视频帧的人脸检测结果;
根据所述人脸检测结果,获取所述视频帧的人脸区域位置;
根据所述人脸区域位置确定所述视频帧的裁剪区域位置,根据所述裁剪区域位置对所述视频帧进行裁剪,获得裁剪后的视频帧,其中,所述裁剪区域大于所述人脸区域;
将所述裁剪后的视频帧渲染到本地显示界面进行显示。
2.根据权利要求1所述的方法,其特征在于,根据所述人脸检测结果,获取所述视频帧的人脸区域位置包括:
根据所述人脸检测结果判断所述视频帧为单人还是多人,在所述视频帧为单人的情况下,获取单人人脸所在的位置,根据所述单人人脸所在的位置确定所述人脸区域位置。
3.根据权利要求2所述的方法,其特征在于,在所述视频帧为多人的情况下,所述方法包括:
获取距离视频帧左边距最小值和最大值对应的目标人脸,以及距离视频帧上边距最小值和最大值对应的目标人脸,或,获取距离视频帧右边距最小值和最大值对应的目标人脸,以及距离视频帧下边距最小值和最大值对应的目标人脸,包含所有所述目标人脸的最小矩形为所述人脸区域位置。
4.根据权利要求1所述的方法,其特征在于,根据所述人脸区域位置确定所述视频帧的裁剪区域位置包括:
获取人脸区域中心,若所述人脸区域中心在预设范围内,则以所述人脸区域中心作为所述裁剪区域中心,根据所述裁剪区域中心确定所述视频帧的裁剪区域位置。
5.根据权利要求4所述的方法,其特征在于,若所述人脸区域中心在预设范围外,则所述方法包括:
假设将人脸区域中心平移至相应的预设范围边界上,以假设的人脸区域中心作为所述裁剪区域中心,根据所述裁剪区域中心确定所述视频帧的裁剪区域位置。
6.根据权利要求4所述的方法,其特征在于,若所述人脸区域中心在预设范围外,则所述方法还包括:
缩小所述裁剪区域,使所述裁剪区域中心在所述人脸区域中心上且裁剪区域不超出视频帧范围。
7.根据权利要求1至6任一项所述的方法,其特征在于,在当前视频帧相对于上一视频帧的人脸区域位置移动的情况下,所述方法还包括:
若所述人脸区域位置在x轴方向上的移动距离和y轴方向上的移动距离小于预设值,则当前视频帧的裁剪区域位置相对于上一视频帧的裁剪区域位置不变。
8.根据权利要求1所述的方法,其特征在于,所述获得裁剪后的视频帧之后,所述方法还包括:
将所述裁剪后的视频帧进行放大或缩小,获得放大或缩小后的视频帧,将所述放大或缩小后的视频帧渲染到本地显示界面进行显示。
9.根据权利要求1所述的方法,其特征在于,所述获得裁剪后的视频帧之后,所述方法还包括:
将所述裁剪后的视频帧渲染到编码器,并输出到对端显示界面进行显示。
10.一种视频通话的处理系统,其特征在于,所述系统包括检测模块、获取模块、裁剪模块和显示模块,
所述检测模块,用于获取视频帧以及所述视频帧的人脸检测结果;
所述获取模块,用于根据所述人脸检测结果,获取所述视频帧的人脸区域位置;
所述裁剪模块,用于根据所述人脸区域位置确定所述视频帧的裁剪区域位置,根据所述裁剪区域位置对所述视频帧进行裁剪,获得裁剪后的视频帧,其中,所述裁剪区域大于所述人脸区域;
所述显示模块,用于将所述裁剪后的视频帧渲染到本地显示界面进行显示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于当趣网络科技(杭州)有限公司,未经当趣网络科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210344525.1/1.html,转载请声明来源钻瓜专利网。