[发明专利]一种基于类别标签和属性注释的多任务属性场景识别方法在审

专利信息
申请号: 202111547952.1 申请日: 2021-12-16
公开(公告)号: CN114241380A 公开(公告)日: 2022-03-25
发明(设计)人: 保罗;李晓晨;张吉 申请(专利权)人: 之江实验室
主分类号: G06V20/40 分类号: G06V20/40;G06K9/62;G06V10/774;G06V10/764
代理公司: 杭州浙科专利事务所(普通合伙) 33213 代理人: 孙孟辉
地址: 311100 浙江省杭州市余*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 类别 标签 属性 注释 任务 场景 识别 方法
【权利要求书】:

1.一种基于类别标签和属性注释的多任务属性场景识别方法,基于多任务属性场景识别网络MASR,其特征在于,具体包括以下步骤:

1)给定场景图像xi,使用CNN网络提取其特征表示为θI为CNN网络参数;

2)采用属性标注策略计算对象属性分数,基于对象属性分数对vi中的属性对象按照对象筛选逻辑进行精简;

3)将精简后的特征vi输入到全连接层L|K|进行分类预测,其中K为场景分类的类数;同时,将精简后的特征vi输入全连接层L|A|预测属性概率patt,其中A为检测到的属性集;

4)将预测的属性概率patt与从外部数据单独学习的属性表示,输入属性层对vi重新进行权重分配,同时运用属性任务损失函数对属性层的任务进行加速;

5)将修正后的vi反馈给全连接层L|K|

2.如权利要求1所述的一种基于类别标签和属性注释的多任务属性场景识别方法,其特征在于,所述属性标注策略是将两个概率分布ps与pt简单合并且将对象检测分数P作为置信度分数即对象属性分数,具体为:

从COCO Object与COCO Panoptic数据集中收集对象属性和上下文信息,对stuff与thing类型做独立处理,设S与T分别为stuff与thing的集合,Fs与Ft为针对各自任务的预训练CNN模型,设{x1,x2,...,xn}∈X表示只有类别标签的以场景为中心的数据集,使用X上的Fs与Ft预测S与T上的分布,ps=Fs(X)与pt=Ft(X),其中,ps∈R|S|与pt∈R|T|分别是S与T的概率分布预测,给定数据集X,最终的stuff+thing预测P∈R|S|+|T|,在给定的场景数据集上定义为P=ps∪pt,其中,P不会增加至1且不代表概率分布,对两个概率分布ps与pt求平均以合并它们,其中,S与T并不总有交集,表示不同的数据源。

3.如权利要求2所述的一种基于类别标签和属性注释的多任务属性场景识别方法,其特征在于,所述对象筛选是根据对象检测分数与对象频率对S与T中的对象做进一步筛选,具体为包括:

基于对象检测分数:丢弃对象检测分数小于阈值的对象实例,只有对象检测分数高于阈值的对象才会被选为场景属性,在此过程中,将P重新定义为:

其中ξ是阈值,当检测分数为0时,对象被认为不存在于场景中;

基于对象频率:进一步考虑给定场景类别的属性频率并删除不常见的对象,对于每个类别c,将相对属性频率定义为覆盖类别图像的非零分数的数量,如果{a1,a2,...,am}∈Ac是c的检测属性集,最优定义为:

其中fc(aj)是给定类别c的值为aj的属性的相对频率,β是最小频率,是c的最终属性列表。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111547952.1/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top