[发明专利]一种基于代价的优化系统处理大规模数据视频的方法在审
申请号: | 201710194734.1 | 申请日: | 2017-03-28 |
公开(公告)号: | CN106970982A | 公开(公告)日: | 2017-07-21 |
发明(设计)人: | 夏春秋 | 申请(专利权)人: | 深圳市唯特视科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高新技术产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 代价 优化 系统 处理 大规模 数据 视频 方法 | ||
1.一种基于代价的优化系统处理大规模数据视频的方法,其特征在于,主要包括NOSCALE系统(一)和系统运行(二),其中NOSCALE系统包括差分检测器、专用模型、优化器。
2.基于权利要求书1所述的NOSCALE系统(一),其特征在于,当首次提供新的视频流时,NOSCALE将目标模型应用于其所有帧,以便开始回答查询,同时训练一个级联的滤波算子来加速对此特定流的特定查询,NOSCALE插入两种类型的滤波算子,首先使用差分检测器来检查当前帧是否与另一个最近帧相似,或者更一般地,检测是否与标签已知的参考图像相似,另外训练回答查询的专用模型,而不将帧传递到完整卷积神经网络(CNN)。
3.基于权利要求书1所述的差分检测器,其特征在于,差分检测器用于确定所检测帧是否与另一带已知标签的图像有着显著差异,支持两种形式的差分检测器:
(1)对已知不包含对象(来自先前调用目标模型并且显示无结果)的视频流中固定参考图像的差分检测,通过对所有帧进行平均来计算参考图像,帧的目标模型不返回任何标签;
(2)对较前帧的差分检测,在这种情况下,如果没有显着差异,NOSCALE返回与前一帧的输出相同的标签,优化器基于输入数据学习tdiff时间。
4.基于权利要求书1所述的专用模型,其特征在于,NOSCALE使用来自大目标CNN的输出作为标签,为每个视频流和查询训练一个小型专用CNN,并配置以下参数,其中卷积层的数目(2或4),基本层中卷积单元的数量(32或64),以及致密层中神经元的数量(32,64,128或256),NOSCALE的优化器为每个视频流选择性能最佳的模型和查询,除此之外,NOSCALE还为其置信度值c选择了两个阈值:clow是低阈值,在其之下则输出0(即帧中不包含对象),而chigh是高阈值,在其之上则输出1(即帧中检测到了对象),对于clow和chigh之间的c的输出值,NOSCALE在该帧上调用完整目标CNN,结合阈值的选择与模型的选择来确定速度和精度。
5.基于权利要求书1所述的优化器,其特征在于,NOSCALE使用基于代价的优化器将差分检测器和模型专用化组合在一起,其可以有效地找到一个模型和阈值的良好组合,优化器接收图像的数据集以及目标精度值FP*和FN*,它们分别是假阳性率和假阴性率的期望上限,优化器解决的问题如下:
maximize E(throughout)
subject to flase positive rate<FP*
and flase negative rate<FN*
执行每个候选滤波器的代价估计并且为它们中的每一个设置几个特定于模型的参数以达到目标精确度,优化器包括三个关键部分:输入数据准备、代价模型、搜索算法。
6.基于权利要求书5所述的输入数据准备,其特征在于,优化器在由完整目标CNN标记的帧的输入数据集上执行,首先将输入数据分成一个训练集和一个仅用于模型选择的评估集(避免导致过拟合),数据按一个较大的连续时间块进行分离,使得评估集中和训练集中的帧在时间上相隔足够远的距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710194734.1/1.html,转载请声明来源钻瓜专利网。