[发明专利]数据对标方法、装置、电子装置和存储介质在审
申请号: | 202210465473.3 | 申请日: | 2022-04-29 |
公开(公告)号: | CN114942941A | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 操涛涛;王龙;刘伟棠;陈立力;周明伟 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/2455;G06K9/62 |
代理公司: | 杭州华进联浙知识产权代理有限公司 33250 | 代理人: | 何晓春 |
地址: | 310051 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 方法 装置 电子 存储 介质 | ||
本申请涉及一种数据对标方法、装置、电子装置和存储介质。其中,该数据对标方法包括:获取数据项和多个多维度检索策略;将数据项输入到多个多维度检索策略中,得到数据项在每个多维度检索策略中的第一检索结果,其中,第一检索结果包括:多个数据元和多个数据元与数据项的相似度;根据每个第一检索结果中的每个数据元与数据项的相似度,确定每个数据元的置信度;根据每个数据元的置信度,对数据项进行对标。通过本申请,解决了相关技术中数据元对标准确率低的问题,提高了数据元对标准确率。
技术领域
本申请涉及数据处理领域,特别是涉及数据对标方法、装置、电子装置和存储介质。
背景技术
近年来,随着大数据、人工智能等技术的成熟和发展,大数据已经成为当前公安信息化工作的趋势和重点。如何通过提高大数据的对标,来提升工作智能化水平,以机器换人力、以智能增效能,最大限度地释放人力,提高相关机构核心战斗力,已成为热点问题。
目前相关技术中行业常见的数据元对标主要方式主要有两种:一种是人工对标的方式,人工对标的方式效率较低,并且根据个人的理解不同,容易造成对标准确率不高的现象;另一种是基于数据项的各维度与标准数据元进行相似度检索的方式,该方式从各角度进行检索,由此会出现多个维度的匹配结果。如何对多个维度的结果进行整合,并且结合各维度匹配结果的优势、弥补各结果预测的短板,仍是一个巨大的挑战。
针对相关技术中存在数据元对标准确率低的问题,目前还没有提出有效的解决方案。
发明内容
在本实施例中提供了一种数据对标方法、装置、电子装置和存储介质,以解决相关技术中数据元对标准确率低的问题。
第一个方面,在本实施例中提供了一种数据对标方法,包括:
获取数据项和多个多维度检索策略;
将所述数据项输入到多个所述多维度检索策略中,得到所述数据项在每个所述多维度检索策略中的第一检索结果,其中,所述第一检索结果包括:多个数据元,以及每个所述数据元与所述数据项的相似度;
根据每个所述第一检索结果中的每个所述数据元与所述数据项的相似度,确定每个所述数据元的置信度;
根据每个所述数据元的置信度,对所述数据项进行对标。
在其中的一些实施例中,所述数据项包括以下至少之一:所述数据项的名称信息、所述数据项的注释信息、所述数据项的数据内容信息;所述多维度检索策略包括以下至少之一:数据元的名称信息、数据元的注释信息、数据元的数据内容信息。
在其中的一些实施例中,根据每个所述第一检索结果中的每个所述数据元与所述数据项的相似度,确定每个所述数据元的置信度包括:
根据每个所述第一检索结果中的每个所述数据元与所述数据项的相似度,以及每个所述多维度检索策略的预设权重,确定每个所述第一检索结果中的每个所述数据元的权重;
根据每个所述第一检索结果中的每个所述数据元的权重,确定每个所述数据元的置信度。
在其中的一些实施例中,根据每个所述第一检索结果中的每个所述数据元的权重,确定每个所述数据元的置信度包括:
基于多个所述多维度检索策略的数量、以及每个所述数据元在每个检测结果出现的次数,确定每个所述数据元的召回频率;
根据所述数据元的召回频率和每个所述第一检索结果中的每个所述数据元的权重,确定每个所述数据元的置信度。
在其中的一些实施例中,所述方法还包括:
获取带预设标签的数据项;
将所述带预设标签的数据项输入到多个所述多维度检索策略中,得到所述带预设标签的数据项在每个所述多维度检索策略中的第二检索结果,所述第二检索结果包括:数据元;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210465473.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置