[发明专利]一种镜头类型信息识别方法及装置在审
申请号: | 201811332139.0 | 申请日: | 2018-11-09 |
公开(公告)号: | CN109508668A | 公开(公告)日: | 2019-03-22 |
发明(设计)人: | 刘思阳 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李金;王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 镜头类型信息 检测框 人脸特征 镜头类型 预设条件 图像 人体识别 人员成本 时间成本 信息确定 自动确定 准确度 抽取 视频 自动化 节约 | ||
本发明提供一种镜头类型信息识别方法及装置,从视频中抽取一帧待识别图像,对待识别图像进行识别,得到待识别图像的识别结果,若识别结果满足预设条件则基于识别结果中的人脸特征进行镜头类型计算以确定镜头类型信息;若识别结果不满足预设条件则进行人体识别,确定包含人体的检测框信息,并基于包含人体的检测框信息进行镜头类型计算以确定镜头类型信息,由此实现镜头类型信息的自动确定,提高确定镜头类型信息的效率,从而节约时间成本和人员成本,并且通过人脸特征和包含人体的检测框信息确定镜头类型信息的方式,使得在基于人脸特征无法识别的情况下仍可通过包含人体的检测框信息来确定镜头类型信息,提高识别自动化和准确度。
技术领域
本发明属于视频处理技术领域,更具体地说,尤其涉及一种镜头类型信息识别方法及装置。
背景技术
目前节目录制过程中因为机位、拍摄角度和拍摄场景等因素会产生大量的视频(简称为原素材),这些原素材可由初级剪辑师进行初剪,以减掉原素材中的部分无用的视频,并对剩余的视频人工标注出组成视频的每帧图像的镜头相关信息,如每帧图像的镜头类型标识和每帧图像的镜头类型标识的置信度。而在节目录制过程中可能产生上百小时的原材料,若由初级剪辑师进行初剪则会造成大量的时间成本和人员成本的浪费。
发明内容
有鉴于此,本发明的目的在于提供一种镜头类型信息识别方法及装置,用于自动确定图像的镜头类型信息。技术方案如下:
本发明提供一种镜头类型信息识别方法,所述方法包括:
从视频中抽取一帧待识别图像;
对所述待识别图像进行识别,得到所述待识别图像的识别结果;
判断所述待识别图像的识别结果是否满足预设条件;
如果所述待识别图像的识别结果满足预设条件,则基于所述识别结果中的人脸特征,确定所述待识别图像的镜头类型信息;
如果所述待识别图像的识别结果不满足预设条件,则从所述待识别图像中确定包含人体的检测框信息,并基于所述包含人体的检测框信息,确定所述待识别图像的镜头类型信息。
优选的,所述方法还包括:判断是否完成对所述视频中每帧待识别图像的处理,如果是,则对任一帧待识别图像的镜头类型信息进行修正,如果否,则返回执行从视频中抽取一帧待识别图像的步骤,以从所述视频中抽取没有确定镜头类型信息的待识别图像。
优选的,所述方法还包括:
将修正后的镜头类型信息存储在所述视频的序列中;
将所述视频的序列中的内容转码成JSON返回结果输出,其中所述JSON返回结果包括:修正所使用代码中的错误代码、视频信息、所述视频中镜头类型错误的图像信息、各个所述待识别图像对应的镜头段信息。
优选的,所述基于所述识别结果中的人脸特征,确定所述待识别图像的镜头类型信息包括:
基于所述人脸特征,得到人脸的特征距离;
计算所述特征距离和所述待识别图像的高度之间的比值;
基于所述特征距离和所述待识别图像的高度之间的比值,确定所述待识别图像的镜头类型信息。
优选的,所述基于所述包含人体的检测框信息,确定所述待识别图像的镜头类型信息包括:
基于所述包含人体的检测框信息,确定检测框的高度;
计算所述检测框的高度与所述待识别图像的高度之间的比值;
基于所述检测框的高度与所述待识别图像的高度之间的比值,确定所述待识别图像的镜头类型信息。
本发明还提供一种镜头类型信息识别装置,所述装置包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811332139.0/2.html,转载请声明来源钻瓜专利网。