[发明专利]信息检测方法、装置、电子设备以及存储介质在审

专利信息
申请号: 202210279038.1 申请日: 2022-03-21
公开(公告)号: CN114638307A 公开(公告)日: 2022-06-17
发明(设计)人: 何永明;李涛;梅丰 申请(专利权)人: 北京达佳互联信息技术有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G06N3/08;G06V10/74;G06V10/82;G06V10/764;G06V10/44
代理公司: 北京中博世达专利商标代理有限公司 11274 代理人: 申健
地址: 100085 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 信息 检测 方法 装置 电子设备 以及 存储 介质
【说明书】:

本公开关于一种信息检测方法、装置、电子设备以及存储介质,涉及数据处理技术领域。本公开实施例至少解决相关技术中,由于分类模型不准确,导致检测同一对象的不同信息表征方式是否一致的结果不准确的问题。该方法包括:获取目标对象的第一特征数据和第二特征数据;根据第一特征数据,在预置对象集合中查找目标对象对应的目标预置对象;根据目标预置对象的第四特征数据和第二特征数据,得到第二模态相似度;如果第二模态相似度大于第二阈值,确定目标对象对应的第一模态数据与目标对象对应的第二模态数据相匹配。将目标对象的单一模态数据分别比较,以判断同一目标对象的不同模态数据是否相匹配,能够提高检测表征方式是否一致的准确性。

技术领域

本公开涉及数据处理技术领域,尤其涉及一种信息检测方法、装置、电子设备以及存储介质。

背景技术

在信息发布场景中,表征同一对象可以采用以下至少两种信息表征方式:文本、视频、图像和语音。在搜索、推荐、广告等领域,根据涵盖信息较少的信息表征方式,判断对应的同一信息是否满足用户需求,因此,表征同一信息对应的至少两种信息表征方式的一致性是十分重要的。

在相关技术中,假设同一对象采用目标文本和目标视频两种信息表征方式,为了检测目标文本与目标视频是否一致,首先获取数据集,上述数据集中包括文本与视频一致的正样本,以及文本与视频不一致的负样本,然后将数据集输入编码器得到特征数据,再根据特征数据输入和二分类交叉熵,训练得到分类模型,最后根据分类模型,检测目标文本与目标视频是否一致。

但是,上述分类模型强依赖于数据集,且上述分类模型的训练方式所需的数据集,是通过人工采集得到的高质量置信样本,采集高质量置信样本的难度较大,导致分类模型不准确,进而导致检测同一对象的不同信息表征方式是否一致的结果不准确。

发明内容

本公开提供一种信息检测方法、装置、电子设备以及存储介质,以至少解决相关技术中,由于采集高质量置信样本的难度较大,导致分类模型不准确,进而导致检测同一对象的不同信息表征方式是否一致的结果不准确问题。本公开的技术方案如下:

根据本公开实施例的第一方面,提供一种检测信息一致性的方法,包括:根据第一单模态双塔模型,获取目标对象的第一特征数据,第一特征数据为目标对象对应的第一模态数据的特征数据,目标对象是多媒体资源对象;根据第二单模态双塔模型,获取目标对象的第二特征数据,第二特征数据为目标对象对应的第二模态数据的特征数据;根据第一特征数据,在预置对象集合中查找目标对象对应的目标预置对象,目标预置对象的第三特征数据与第一特征数据之间的第一模态相似度大于或等于第一阈值,第三特征数据为目标预置对象对应的第一模态数据的特征数据;预置对象集合包括至少一个预置对象,预置对象对应的第一模态数据的特征数据,与预置对象对应的第二模态数据的特征数据相匹配;根据目标预置对象的第四特征数据和第二特征数据,得到目标预置对象与目标对象之间的第二模态相似度,第四特征数据为目标预置对象对应的第二模态数据的特征数据;在第二模态相似度大于第二阈值的情况下,确定目标对象对应的第一模态数据与目标对象对应的第二模态数据相匹配。

可选的,在目标预置对象的数量大于1的情况下,上述“根据目标预置对象的第四特征数据和第二特征数据,得到目标预置对象与目标对象之间的第二模态相似度”,包括:根据每个目标预置对象的第四特征数据和第二特征数据,得到每个目标预置对象与目标对象之间的第三模态相似度;将每个目标预置对象与目标对象之间的第三模态相似度的平均值,确定为目标预置对象与目标对象之间的第二模态相似度。

可选的,上述信息检测方法还包括:根据第一单模态双塔模型,获取目标对象的第一特征数据之前,根据目标对象对应的第一模态数据的数据类型,确定第一单模态双塔模型,第一单模态双塔模型是根据第一样本数据训练得到的,第一样本数据的数据类型与第一模态数据的数据类型相同;根据第二单模态双塔模型,获取目标对象的第二特征数据之前,根据目标对象对应的第二模态数据的数据类型,确定第二单模态双塔模型,第二单模态双塔模型是根据第二样本数据训练得到的,第二样本数据的数据类型与第二模态数据的数据类型相同。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210279038.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top