[发明专利]基于跨模态语义表征学习和融合的图像分类方法及系统在审

专利信息
申请号: 202210558899.3 申请日: 2022-05-21
公开(公告)号: CN114898156A 公开(公告)日: 2022-08-12
发明(设计)人: 孟雷;李象贤;郑裕泽;马浩凯;齐壮;孟祥旭 申请(专利权)人: 山东大学
主分类号: G06V10/764 分类号: G06V10/764;G06V10/80;G06V10/77;G06V10/82;G06V10/774;G06N3/04;G06N3/08
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 王雪
地址: 250000 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 跨模态 语义 表征 学习 融合 图像 分类 方法 系统
【权利要求书】:

1.基于跨模态语义表征学习和融合的图像分类方法,其特征在于,包括:

将获取的图像编码为视觉表征;

采用部分异构迁移算法从视觉表征学习与分类紧密相关的视觉分类表征;

基于视觉表征,通过跨模态语义信息推理得到跨模态的语义信息推理结果,采用类感知信息选择算法对跨模态的语义信息推理结果计算高阶语义表征;

融合视觉分类表征和高阶语义表征生成融合表征,基于融合表征进行图像识别分类。

2.如权利要求1所述的基于跨模态语义表征学习和融合的图像分类方法,其特征在于,所述采用部分异构迁移算法从视觉表征学习与分类紧密相关的视觉分类表征,包括:

利用单标签分类和多标签分类任务中的分类损失,筛选出由关键分类信息构成的视觉分类表征;

将部分异构迁移后文本模态的语义分类表征作为先验知识,将视觉分类表征和语义分类表征进行对齐,得到最终的视觉分类表征。

3.如权利要求2所述的基于跨模态语义表征学习和融合的图像分类方法,其特征在于,通过交叉CE熵和二元交叉熵BCE损失分别计算单标签分类和多标签分类任务中的分类损失:

其中,F为样本在视觉或文本模态中对应的分类表征,y为样本对应的标签,SL表示单标签,ML表示多标签,视觉分类表征或语义分类表征通过映射c(.)输出类别预测信息。

4.如权利要求1所述的基于跨模态语义表征学习和融合的图像分类方法,其特征在于,基于视觉表征,通过跨模态语义信息推理得到跨模态的语义信息推理结果,包括:

将视觉表征经过跨模态迁移转换为语义表征;

语义表征通过语义解码器转生成跨模态的语义信息推理结果。

5.如权利要求1所述的基于跨模态语义表征学习和融合的图像分类方法,其特征在于,所述采用类感知信息选择算法对跨模态的语义信息推理结果计算高阶语义表征,包括:

将跨模态的语义信息推理结果通过嵌入映射生成语义嵌入;

将类别相关的文本分布知识作为先验知识,根据各分类中出现各类文本的分布情况频次映射到不同权重比值;

利用重构语义关系矩阵融合各类文本的分布情况频次映射到不同权重比值,得到语义权重向量;

通过类别选择信息为重构语义嵌入提供文本间的语义权重向量,利用图卷积计算文本嵌入经过类别选择信息选择后的表征,得到高阶语义表征。

6.如权利要求5所述的基于跨模态语义表征学习和融合的图像分类方法,其特征在于,重构语义关系矩阵的构成,具体为:

跨模态的语义信息推理结果根据模型的预测输出由大到小排列,得到文本预测集合text={t1,t2,…,tn},其中,n表示文本的总数,t表示对文本的预测值;

选取前k个文本形成文本预测子集texttopk={t1,t2,…,tk},表示为模型预测最有可能出现前k个文本;

由texttopk构建重构语义关系矩阵R,为主对角线为1的对角矩阵,除主对角线之外的其它位置:

其中i,j分别表示矩阵中的行坐标和列坐标。

7.如权利要求1所述的基于跨模态语义表征学习和融合的图像分类方法,其特征在于,所述融合视觉分类表征和高阶语义表征生成融合表征,具体为:

Ff=τ(fusion(τ(Fvc),τ(Fh)))

其中,视觉分类表征Fvc和高阶语义表征Fh;fusion(.)是指表征的融合操作,如表征拼接、求和、取最大值和取最小值操作,τ(.)是指一层全连接层后接ReLU(.)激活函数;Ff表示融合表征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210558899.3/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top