[发明专利]一种视音频节目的导播方法、装置、设备、系统及介质在审
申请号: | 202210291291.9 | 申请日: | 2022-03-23 |
公开(公告)号: | CN114666457A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 窦阳超;石业瀚;刘海鹏;韩春 | 申请(专利权)人: | 华创高科(北京)技术有限公司 |
主分类号: | H04N5/222 | 分类号: | H04N5/222;H04N5/247;H04N5/232;G06V20/40;G06V40/16;G06V40/20;G06N3/04;G06N3/06;G10L15/18;G10L25/57 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 李飞 |
地址: | 100000 北京市东城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 节目 导播 方法 装置 设备 系统 介质 | ||
本申请实施例提供一种视音频节目的导播方法、装置、设备、系统及介质,该方法包括:获取多个待导播数据,其中,所述多个待导播数据是在视音频节目制作过程中由多台视音频信号采集设备获得的,一个待导播数据包括一段音频信号和/或至少一帧图像;通过至少一个神经网络模型获取所述多个待导播数据中的人物特征,其中,所述人物特征至少用于表征所述视音频类节目中人物的行为;根据所述人物特征完成对所述视音频节目的导播。通过本申请的一些实施例能够实现视音频节目的自动导播,降低了人工成本,同时能够提升节目导播质量。
技术领域
本申请实施例涉及节目导播领域,具体涉及一种视音频节目的导播方法、装置、设备、系统及介质。
背景技术
相关技术中,视音频节目的制作和播出需要专业的导播系统和工作人员。例如,视频节目导播需要通过切换画面来完成节目的播出,具体地节目导播过程通常需要依赖工作人员手工切换画面或者视音频采集设备,导致增加了制作成本,降低了导播效率。
为了解决上述问题,相关技术中采用预先制作分镜脚本的方法来实现节目导播,由于预先制作脚本需要提前明确节目名单以及演员人数等信息,所以只能应用于单一的节目,或者,根据声源位置引导镜头拍摄,但均缺乏灵活性,不能实现视音频节目的全自动导播。
因此,如何提升视音频节目导播的灵活性成为需要解决的问题。
发明内容
本申请实施例提供一种视音频节目的导播方法、装置、设备、系统及介质,通过本申请的一些实施例至少能够实现自动对视音频节目进行导播,同时提升导播过程中的灵活性。
第一方面,本申请提供了一种视音频节目的导播方法,所述导播方法包括:获取多个待导播数据,其中,所述多个待导播数据是在视音频节目制作过程中由多台视音频信号采集设备获得的,一个待导播数据包括一段音频信号和/或至少一帧图像;通过至少一个神经网络模型获取所述多个待导播数据中的人物特征,其中,所述人物特征至少用于表征所述视音频类节目中人物的行为;根据所述人物特征完成对所述视音频节目的导播。
因此,区别于相关技术中使用预设脚本进行节目导播,本申请实施例通过至少一个神经网络模型获取多个待导播数据中的人物特征能够实现视音频节目的自动导播,降低了人工成本,提升节目导播质量,同时,由于本申请无需预设脚本,因此提升了导播的灵活性。
结合第一方面,在本申请的一种实施方式中,所述根据所述人物特征完成对所述视音频节目的导播,包括:根据所述人物特征控制所述视音频信号采集设备获取新的待导播数据。
因此,本申请实施例通过根据人物特征控制视音频信号采集设备获取新的待导播数据,能够获得质量更好的待导播数据,从而提升导播质量和效率。
结合第一方面,在本申请的一种实施方式中,所述多个待导播数据为多帧图像,所述多帧图像中的至少一帧图像包括目标人物,所述至少一个神经网络模型包括行为跟踪网络;其中,所述通过至少一个神经网络模型获取所述多个待导播数据中的人物特征,包括:将所述多帧图像输入所述行为跟踪网络;通过所述行为跟踪网络确定所述目标人物处于移动状态,其中,所述人物特征包括所述目标人物处于移动状态;所述根据所述人物特征控制所述视音频信号采集设备获取新的待导播数据,包括:控制目标视音频信号采集设备对所述目标人物进行跟随拍摄,获取所述新的待导播数据。
因此,本申请实施例通过识别目标人物处于移动状态,控制目标视音频信号采集设备对目标人物进行跟踪拍摄,能够使目标人物始终保持在画面中间,从而提升导播质量。
结合第一方面,在本申请的一种实施方式中,所述至少一个神经网络模型包括人脸检测网络;其中,所述通过至少一个神经网络模型获取所述多个待导播数据中的人物特征,包括:将所述多帧图像输入所述人脸检测网络;通过所述人脸检测网络确定所述目标人物的数量,其中,所述人物特征包括所述目标人物的数量;所述根据所述人物特征控制所述视音频信号采集设备获取新的待导播数据,包括:控制目标视音频信号采集设备根据所述目标人物的数量,获取新的待导播数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华创高科(北京)技术有限公司,未经华创高科(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210291291.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于空间几何的三维可视化大屏构建方法
- 下一篇:一种圆盘刀具