[发明专利]数据对标方法、装置、电子装置和存储介质在审

专利信息
申请号: 202210465473.3 申请日: 2022-04-29
公开(公告)号: CN114942941A 公开(公告)日: 2022-08-26
发明(设计)人: 操涛涛;王龙;刘伟棠;陈立力;周明伟 申请(专利权)人: 浙江大华技术股份有限公司
主分类号: G06F16/2453 分类号: G06F16/2453;G06F16/2455;G06K9/62
代理公司: 杭州华进联浙知识产权代理有限公司 33250 代理人: 何晓春
地址: 310051 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 方法 装置 电子 存储 介质
【说明书】:

本申请涉及一种数据对标方法、装置、电子装置和存储介质。其中,该数据对标方法包括:获取数据项和多个多维度检索策略;将数据项输入到多个多维度检索策略中,得到数据项在每个多维度检索策略中的第一检索结果,其中,第一检索结果包括:多个数据元和多个数据元与数据项的相似度;根据每个第一检索结果中的每个数据元与数据项的相似度,确定每个数据元的置信度;根据每个数据元的置信度,对数据项进行对标。通过本申请,解决了相关技术中数据元对标准确率低的问题,提高了数据元对标准确率。

技术领域

本申请涉及数据处理领域,特别是涉及数据对标方法、装置、电子装置和存储介质。

背景技术

近年来,随着大数据、人工智能等技术的成熟和发展,大数据已经成为当前公安信息化工作的趋势和重点。如何通过提高大数据的对标,来提升工作智能化水平,以机器换人力、以智能增效能,最大限度地释放人力,提高相关机构核心战斗力,已成为热点问题。

目前相关技术中行业常见的数据元对标主要方式主要有两种:一种是人工对标的方式,人工对标的方式效率较低,并且根据个人的理解不同,容易造成对标准确率不高的现象;另一种是基于数据项的各维度与标准数据元进行相似度检索的方式,该方式从各角度进行检索,由此会出现多个维度的匹配结果。如何对多个维度的结果进行整合,并且结合各维度匹配结果的优势、弥补各结果预测的短板,仍是一个巨大的挑战。

针对相关技术中存在数据元对标准确率低的问题,目前还没有提出有效的解决方案。

发明内容

在本实施例中提供了一种数据对标方法、装置、电子装置和存储介质,以解决相关技术中数据元对标准确率低的问题。

第一个方面,在本实施例中提供了一种数据对标方法,包括:

获取数据项和多个多维度检索策略;

将所述数据项输入到多个所述多维度检索策略中,得到所述数据项在每个所述多维度检索策略中的第一检索结果,其中,所述第一检索结果包括:多个数据元,以及每个所述数据元与所述数据项的相似度;

根据每个所述第一检索结果中的每个所述数据元与所述数据项的相似度,确定每个所述数据元的置信度;

根据每个所述数据元的置信度,对所述数据项进行对标。

在其中的一些实施例中,所述数据项包括以下至少之一:所述数据项的名称信息、所述数据项的注释信息、所述数据项的数据内容信息;所述多维度检索策略包括以下至少之一:数据元的名称信息、数据元的注释信息、数据元的数据内容信息。

在其中的一些实施例中,根据每个所述第一检索结果中的每个所述数据元与所述数据项的相似度,确定每个所述数据元的置信度包括:

根据每个所述第一检索结果中的每个所述数据元与所述数据项的相似度,以及每个所述多维度检索策略的预设权重,确定每个所述第一检索结果中的每个所述数据元的权重;

根据每个所述第一检索结果中的每个所述数据元的权重,确定每个所述数据元的置信度。

在其中的一些实施例中,根据每个所述第一检索结果中的每个所述数据元的权重,确定每个所述数据元的置信度包括:

基于多个所述多维度检索策略的数量、以及每个所述数据元在每个检测结果出现的次数,确定每个所述数据元的召回频率;

根据所述数据元的召回频率和每个所述第一检索结果中的每个所述数据元的权重,确定每个所述数据元的置信度。

在其中的一些实施例中,所述方法还包括:

获取带预设标签的数据项;

将所述带预设标签的数据项输入到多个所述多维度检索策略中,得到所述带预设标签的数据项在每个所述多维度检索策略中的第二检索结果,所述第二检索结果包括:数据元;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210465473.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top