[发明专利]档案编研数据生方法及装置、电子设备和存储介质在审

专利信息
申请号: 202310006058.6 申请日: 2023-01-03
公开(公告)号: CN115905579A 公开(公告)日: 2023-04-04
发明(设计)人: 高明 申请(专利权)人: 中国建设银行股份有限公司;建信金融科技有限责任公司
主分类号: G06F16/38 分类号: G06F16/38;G06F16/28;G06F16/25;G06F40/30;G06F40/289;G06F21/64
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 樊晓
地址: 100033 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 档案 数据 方法 装置 电子设备 存储 介质
【说明书】:

本公开提供了一种档案编研数据生方法及装置、电子设备和存储介质,可以应用于大数据技术领域。该档案编研数据生成方法包括基于原始档案数据文件生成多个三元组数据;计算多个三元组数据中至少一条目标三元组数据各自的参考值;基于至少一条目标三元组数据各自的参考值以及多个三元组数据,生成档案编研数据。

技术领域

本公开涉及大数据技术领域,具体涉及一种档案编研数据生成方法、装置、设备、介质和程序产品。

背景技术

档案编研是档案利用工作中的一个重要组成部分,是档案部门向社会或者向机构普通用户提供利用服务的基础性工作。随着档案工作数字化发展,档案资料的线上调阅变得越来越简单,也为档案编研工作者提供了便利。但是由于档案数据量大、档案种类繁多、载体形式多、档案编研工作要求高,给档案编研工作带来了极大的挑战。

在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:现有档案编研工作对人工依赖程度高、编研内容完整性难以保证、编研工作量大、效果不佳,并且由于同名人物的存在,增加了档案编研人员的工作难度,经常出现对于同名人无法正确区分的问题。

发明内容

鉴于上述问题,本公开提供了一种档案编研数据生成方法、装置、设备、介质和程序产品。

本公开的一个方面,提供了一种档案编研数据生成方法,包括:

基于原始档案数据文件生成多个三元组数据,其中各个三元组数据包括第一实体、第二实体、第一实体和第二实体之间的关联关系,第一实体和第二实体的类别为预设实体类别之一,预设实体类别至少包括人物、事件、机构;

计算多个三元组数据中至少一条目标三元组数据各自的参考值,其中,目标三元组数据中的第一目标实体属于人物实体类别,目标三元组数据中的第二目标实体属于预设实体类别之一,参考值用于表征:第一目标实体和第二目标实体之间关联关系的准确性;

基于至少一条目标三元组数据各自的参考值以及多个三元组数据,生成档案编研数据。

根据本公开的实施例,计算目标三元组数据的参考值包括:

确定与目标三元组数据关联的目标指标的指标值和指标权重,其中目标指标包括以下至少之一:第一实体指标、第二实体指标、全局命中率指标,其中,第一实体指标与第一目标实体的属性关联,第二实体指标与第二目标实体的属性关联,全局命中率指标与第一目标实体和第二目标实体同时关联;

根据与目标三元组数据关联的目标指标的指标值和指标权重,计算得到目标三元组数据的参考值。

根据本公开的实施例,其中,确定与目标三元组数据关联的全局命中率指标的指标值包括:

确定目标三元组数据在原始档案数据文件中的第一引用次数;

确定多个三元组数据中的至少一个关联数据分别在原始档案数据文件中的第二引用次数,其中关联数据与目标三元组数据中的人物名称相同,且关联数据中的第二实体与目标三元组数据中的第二目标实体属于同一实体类别;

计算第一引用次数与至少一个第二引用次数之和的比值,以得到全局命中率指标的指标值。

根据本公开的实施例,其中,确定与目标三元组数据关联的第一实体指标的指标值包括:

从原始档案数据文件中抽取第一目标实体的属性值,其中第一目标实体的属性值包括与第一目标实体对应的人物职级;

根据第一预设打分规则,确定与第一目标实体的属性值对应的分数,作为第一实体指标的指标值。

根据本公开的实施例,其中,确定与目标三元组数据关联的第二实体指标的指标值包括:

从原始档案数据文件中抽取第二目标实体的属性值;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司;建信金融科技有限责任公司,未经中国建设银行股份有限公司;建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310006058.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top