[发明专利]一种视频直播监控方法及相关装置在审
申请号: | 202011486711.6 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112492343A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 韩加旭;周祥明 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | H04N21/2187 | 分类号: | H04N21/2187;H04N21/233;H04N21/234;H04N21/439;H04N21/44 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 黎坚怡 |
地址: | 310051 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 直播 监控 方法 相关 装置 | ||
1.一种视频直播监控方法,其特征在于,包括:
获得当前视频直播片段的视频数据以及音频数据;
对所述视频数据和所述音频数据分别进行违规检测,以分别获得视频违规概率和音频违规概率;
根据所述视频违规概率和所述音频违规概率获得综合违规概率;
判断所述综合违规概率与预设范围的关系;
若所述综合违规概率大于所述预设范围的最大值,则输出违规报警信息;若所述综合违规概率小于所述预设范围的最小值,则不输出违规报警信息;若所述综合违规概率位于所述预设范围内,则将所述当前视频直播片段发送至检测人员的终端,并接收所述检测人员的人工审核结果。
2.根据权利要求1所述的视频直播监控方法,其特征在于,对所述视频数据进行违规检测,以获得视频违规概率的步骤包括:
将所述视频数据中的每个视频帧分别输入至违规检测模型中以获得所述视频帧中含有违规信息的置信度;
将所有视频帧对应的置信度中的最大值作为所述视频违规概率。
3.根据权利要求2所述的视频直播监控方法,其特征在于,所述获得当前视频流的视频数据以及音频数据的步骤之前,还包括:
获得直播视频中的多个样本图像,并对所述样本图像进行预处理;
利用多个所述样本图像训练违规检测模型,其中,所述违规检测模型包括R-CNN、R-FCN、YOLO、SSD中任意一种。
4.根据权利要求1所述的视频直播监控方法,其特征在于,对所述音频数据进行违规检测,以获得音频违规概率的步骤包括:
将所述音频数据分别输入声学模型和语言模型中,以获得对应的文本数据;
将所述文本数据输入文本分类模型中,以获得对应的文本类别;
根据所述文本类别获得对应的音频违规概率。
5.根据权利要求4所述的视频直播监控方法,其特征在于,所述获得当前视频流的视频数据以及音频数据的步骤之前,还包括:
获得直播视频中的多个样本语音;
利用多个所述样本语音训练所述声学模型和所述语言模型,其中,所述声学模型包括GMM、HMM、TDNN、RNN中任意一种,所述语言模型包括N-gram、RNN中任意一种。
6.根据权利要求4所述的视频直播监控方法,其特征在于,所述获得当前视频流的视频数据以及音频数据的步骤之前,还包括:
利用多个所述样本文本训练所述文本分类模型,其中,所述文本分类模型包括FastText、TextCNN、LSTM、Bert中任意一种。
7.根据权利要求1所述的视频直播监控方法,其特征在于,所述根据所述视频违规概率和所述音频违规概率获得综合违规概率的步骤包括:
获得所述视频违规概率和第一系数的第一乘积、以及所述音频违规概率和第二系数的第二乘积,并将所述第一乘积和所述第二乘积之和作为所述综合违规概率;其中,第一系数和第二系数大于或等于0,且两者之和为1。
8.根据权利要求7所述的视频直播监控方法,其特征在于,响应于所述视频违规概率大于或等于所述预设阈值,则所述第一系数和所述第二系数非零;响应于所述视频违规概率小于所述预设阈值,则所述第一系数为0。
9.一种视频直播监控装置,其特征在于,包括相互耦接的存储器和处理器,所述存储器内存储有程序指令,所述处理器用于执行所述程序指令以实现权利要求1至8中任一项所述的视频直播监控方法。
10.一种存储装置,其特征在于,存储有能够被处理器运行的程序指令,所述程序指令用于实现权利要求1至8任一项所述的视频直播监控方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011486711.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种保持红外热疗辐射平衡的方法及装置
- 下一篇:定量自动输送调整分片器装置