[发明专利]基于多视图信息融合的教育领域图像场景图生成方法在审
申请号: | 202211156523.6 | 申请日: | 2022-09-22 |
公开(公告)号: | CN115761036A | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 宋凌云;伍智广;张炀;尚学群;张弛;李战怀 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06T11/20 | 分类号: | G06T11/20;G06T11/60;G06V10/764;G06V10/82;G06N5/02;G06N7/01 |
代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 刘新琼 |
地址: | 71007*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视图 信息 融合 教育 领域 图像 场景 生成 方法 | ||
1.一种基于多视图信息融合的教育领域图像场景图生成方法,其特征在于步骤如下:
步骤1:多视图的构建
步骤1.1:对象视图的构建:利用Faster R-CNN对象检测器,识别图中对象的类别和位置坐标,并利用卷积神经网络构建被识别对象的视觉信息编码,与图中对象进行结合,作为视觉图的一个节点构建一个全连接的对象视图;
步骤1.2:语义视图的构建:首先基于OCR技术和无监督语义分割技术,细粒度地识别图中文本信息,然后对不同类别的上下文信息进行加权融合,增加网络的推理能力,最后构成一个全连接的语义视图;
步骤2:多视图信息融合模块的构建
步骤2.1:语义视图和对象视图的融合:利用语义视图中的节点信息,使用图卷积网络,在语义视图和对象视图之间构建一个全连接的网络,对对象视图中的节点信息进行更新,期望以此获得对象间的语义信息;
步骤2.2:对象视图的自融合:在融合过语义视图之后,利用步骤2.1的融合方法,构建对象视图之间的全连接网络,对对象视图进行自更新;
步骤3:视觉场景图生成模块的构建
步骤3.1:基于语义关系的视觉场景图的生成:对象视图的节点特征更新后,通过计算节点之间语义交互的概率分布,生成基于语义关系的视觉场景图;视觉场景图中的节点代表对象的区域及其类别标签,边表示视觉对象之间的语义交互类别;
步骤3.2:基于位置关系的视觉场景图的生成:首先利用视觉对象的边界框的交并比Intersection over Union,判断两个对象之间是否存在包含或重叠的关系;若IOU0.5,则通过计算它们边界框中心点之间的距离及角度,来判断它们之间的细粒度位置交互类别,所述的细粒度位置交互类别包括上、下、左、右、左上、左下、右上和右下八种类别。
2.根据权利要求1所述基于多视图信息融合的教育领域图像场景图生成方法,其特征在于:步骤2.1中所述的语义视图和对象视图的融合方法,具体如下:
利用语义视图中的节点信息,使用图卷积网络,在语义视图和对象视图之间构建一个全连接的网络,对对象视图中的节点信息进行更新;针对对象视图中的节点oi,其特征向量更新公式如下:
其中N(i)是节点oi的邻居节点的集合,b代表模型的偏移量,W代表模型的参数,l代表对象视图中节点信息的更新迭代次数,cji通过下式计算得到,代表着节点度的标准差;
σ代表着Relu激活函数,即
f(x)=max(0,x), (2-3)
eji代表着在N(i)中,节点oj到节点oi的权重,可由下式计算得到:
ρ[si,oj]代表着si和oj的相似程度,由si和oj的类别和视觉特征共同决定;由下式计算得到;
ρ[si,oj]=fs((fl(si)·fl(oj))||(ffe(si)·ffe(oj))), (2-5)
fl(·)是类别编码器,通过Fasttext获取类别代表的词向量;ffe(·)代表视觉特征映射器,将高维的视觉特征映射到低维空间中;fs(·)是相似度编码器,用于计算两个节点之间的相似程度;
distance(si,oj)代表两个物体之间的距离,物体间距离越远,两物体互相影响的程度就越浅;“||”代表着拼接操作,将物体间距离和相似程度拼接在一起;将si对oj的影响系数在节点oj处归一化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211156523.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电池片的颜色分级方法、装置、电子设备及计算机介质
- 下一篇:木地板工艺
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置