[发明专利]基于多视图信息融合的教育领域图像场景图生成方法在审

专利信息
申请号: 202211156523.6 申请日: 2022-09-22
公开(公告)号: CN115761036A 公开(公告)日: 2023-03-07
发明(设计)人: 宋凌云;伍智广;张炀;尚学群;张弛;李战怀 申请(专利权)人: 西北工业大学
主分类号: G06T11/20 分类号: G06T11/20;G06T11/60;G06V10/764;G06V10/82;G06N5/02;G06N7/01
代理公司: 西安凯多思知识产权代理事务所(普通合伙) 61290 代理人: 刘新琼
地址: 71007*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 视图 信息 融合 教育 领域 图像 场景 生成 方法
【权利要求书】:

1.一种基于多视图信息融合的教育领域图像场景图生成方法,其特征在于步骤如下:

步骤1:多视图的构建

步骤1.1:对象视图的构建:利用Faster R-CNN对象检测器,识别图中对象的类别和位置坐标,并利用卷积神经网络构建被识别对象的视觉信息编码,与图中对象进行结合,作为视觉图的一个节点构建一个全连接的对象视图;

步骤1.2:语义视图的构建:首先基于OCR技术和无监督语义分割技术,细粒度地识别图中文本信息,然后对不同类别的上下文信息进行加权融合,增加网络的推理能力,最后构成一个全连接的语义视图;

步骤2:多视图信息融合模块的构建

步骤2.1:语义视图和对象视图的融合:利用语义视图中的节点信息,使用图卷积网络,在语义视图和对象视图之间构建一个全连接的网络,对对象视图中的节点信息进行更新,期望以此获得对象间的语义信息;

步骤2.2:对象视图的自融合:在融合过语义视图之后,利用步骤2.1的融合方法,构建对象视图之间的全连接网络,对对象视图进行自更新;

步骤3:视觉场景图生成模块的构建

步骤3.1:基于语义关系的视觉场景图的生成:对象视图的节点特征更新后,通过计算节点之间语义交互的概率分布,生成基于语义关系的视觉场景图;视觉场景图中的节点代表对象的区域及其类别标签,边表示视觉对象之间的语义交互类别;

步骤3.2:基于位置关系的视觉场景图的生成:首先利用视觉对象的边界框的交并比Intersection over Union,判断两个对象之间是否存在包含或重叠的关系;若IOU0.5,则通过计算它们边界框中心点之间的距离及角度,来判断它们之间的细粒度位置交互类别,所述的细粒度位置交互类别包括上、下、左、右、左上、左下、右上和右下八种类别。

2.根据权利要求1所述基于多视图信息融合的教育领域图像场景图生成方法,其特征在于:步骤2.1中所述的语义视图和对象视图的融合方法,具体如下:

利用语义视图中的节点信息,使用图卷积网络,在语义视图和对象视图之间构建一个全连接的网络,对对象视图中的节点信息进行更新;针对对象视图中的节点oi,其特征向量更新公式如下:

其中N(i)是节点oi的邻居节点的集合,b代表模型的偏移量,W代表模型的参数,l代表对象视图中节点信息的更新迭代次数,cji通过下式计算得到,代表着节点度的标准差;

σ代表着Relu激活函数,即

f(x)=max(0,x), (2-3)

eji代表着在N(i)中,节点oj到节点oi的权重,可由下式计算得到:

ρ[si,oj]代表着si和oj的相似程度,由si和oj的类别和视觉特征共同决定;由下式计算得到;

ρ[si,oj]=fs((fl(si)·fl(oj))||(ffe(si)·ffe(oj))), (2-5)

fl(·)是类别编码器,通过Fasttext获取类别代表的词向量;ffe(·)代表视觉特征映射器,将高维的视觉特征映射到低维空间中;fs(·)是相似度编码器,用于计算两个节点之间的相似程度;

distance(si,oj)代表两个物体之间的距离,物体间距离越远,两物体互相影响的程度就越浅;“||”代表着拼接操作,将物体间距离和相似程度拼接在一起;将si对oj的影响系数在节点oj处归一化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211156523.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top