[发明专利]视频视觉关系检测的关系片段连接方法有效

专利信息
申请号: 202010722710.0 申请日: 2020-07-24
公开(公告)号: CN111967336B 公开(公告)日: 2022-08-19
发明(设计)人: 姜育刚;苏子轩;陈静静 申请(专利权)人: 复旦大学
主分类号: G06V20/40 分类号: G06V20/40;G06F16/71;G06F16/901
代理公司: 上海正旦专利代理有限公司 31200 代理人: 陆飞;陆尤
地址: 200433 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 视频 视觉 关系 检测 片段 连接 方法
【权利要求书】:

1.一种视频视觉关系检测的关系片段连接方法,其特征在于,通过建立树的结构,保留关系片段间多种可能的连接方式,然后利用前后文的信息来进行各个连接方式间的选择和处理;所述的关系片段连接方法;其中,本发明采用了树的结构来进行关系片段的连接;其中,所述树结构中,每个节点代表一个关系片段,包含:关系主语、谓语和宾语的三元组、主语和宾语的轨迹片段以及预测的置信分数;树的每一层代表一个视频片段,在该层中的每个节点都为该视频片段中检测出的关系片段;每棵树构建一个视觉关系的所有可能连接方式,从根节点到叶子节点的一条路径即代表一种可能的连接构成,即一种连接假设;在多假设连接的过程中,视频片段会按照时间顺序被依次输入和处理,即每一处理周期中,由之前视频片段构建的多假设树用当前视频片段中的关系片段来更新;

多假设连接方法的每一处理周期中,依次通过如下三个操作:连接筛选、假设计分、树枝修剪:

连接筛选,即每棵树的每个叶子节点都要从当前视频片段中选择所有可以连接的关系片段进行连接,构成新的叶子节点,也即向现有树上添加新的待连接关系片段;

假设计分,即对当前每棵树中的每个连接假设进行置信分数的计算,即确定各个假设的可信度;

树枝修剪,即根据现有信息对树进行剪枝,去掉已可以判定为低可信度的假设;

所述的连接筛选,具体操作步骤如下:

步骤1:每棵树的每个叶子节点选取所有满足条件的待连接关系片段进行连接,构成新的叶子节点;这里,所述选取所有满足条件的待连接关系片段进行连接,其连接条件为关系三元组相同、且主语连接分数和谓语连接分数都大于阈值;主语和谓语连接分数的计算公式设计如下:

scon,s=α·vIoUs+β·ss

scon,o=α·vIoUo+β·so

vIoU的定义为两个轨迹的时间重合区间里每一帧上的IoU之和,vIoUs和vIoUo分别计算待连接关系片段和叶子节点间主语和宾语轨迹的vIoU,而ss和so为待连接关系片段中主语和谓语标签预测的置信分数,α和β为超参数;

步骤2:将未被任何叶子节点选择的关系片段作为根节点生成新的树;

所述的假设计分,具体操作步骤如下:

步骤1:遍历当前每棵树中的每个连接假设,对它们进行置信分数的计算;置信分数的计算公式设计如下:

spath=AVG(srel)

其中,srel为每个节点的节点分数,它是上一步骤中的两个连接分数以及谓语预测置信分数sp的加权平均值,γ为超参数,根节点由于无法计算连接分数,所以其节点分数设置为其关系三元组的总预测置信分数,即ss*so*sp/10f,f为缩放因子,用于保证计算出的根节点的节点分数的数量级与其他节点相同,spath是树中的每个连接假设的分数,即每条从根节点到叶子节点的路径的分数,由路径中经过的每个节点分数取平均而得,用于表示该连接假设的可信度;AVG()表示取平均值的函数操作。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010722710.0/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top