[发明专利]档案编研数据生方法及装置、电子设备和存储介质在审
申请号: | 202310006058.6 | 申请日: | 2023-01-03 |
公开(公告)号: | CN115905579A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 高明 | 申请(专利权)人: | 中国建设银行股份有限公司;建信金融科技有限责任公司 |
主分类号: | G06F16/38 | 分类号: | G06F16/38;G06F16/28;G06F16/25;G06F40/30;G06F40/289;G06F21/64 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 樊晓 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 档案 数据 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种档案编研数据生方法及装置、电子设备和存储介质,可以应用于大数据技术领域。该档案编研数据生成方法包括基于原始档案数据文件生成多个三元组数据;计算多个三元组数据中至少一条目标三元组数据各自的参考值;基于至少一条目标三元组数据各自的参考值以及多个三元组数据,生成档案编研数据。
技术领域
本公开涉及大数据技术领域,具体涉及一种档案编研数据生成方法、装置、设备、介质和程序产品。
背景技术
档案编研是档案利用工作中的一个重要组成部分,是档案部门向社会或者向机构普通用户提供利用服务的基础性工作。随着档案工作数字化发展,档案资料的线上调阅变得越来越简单,也为档案编研工作者提供了便利。但是由于档案数据量大、档案种类繁多、载体形式多、档案编研工作要求高,给档案编研工作带来了极大的挑战。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:现有档案编研工作对人工依赖程度高、编研内容完整性难以保证、编研工作量大、效果不佳,并且由于同名人物的存在,增加了档案编研人员的工作难度,经常出现对于同名人无法正确区分的问题。
发明内容
鉴于上述问题,本公开提供了一种档案编研数据生成方法、装置、设备、介质和程序产品。
本公开的一个方面,提供了一种档案编研数据生成方法,包括:
基于原始档案数据文件生成多个三元组数据,其中各个三元组数据包括第一实体、第二实体、第一实体和第二实体之间的关联关系,第一实体和第二实体的类别为预设实体类别之一,预设实体类别至少包括人物、事件、机构;
计算多个三元组数据中至少一条目标三元组数据各自的参考值,其中,目标三元组数据中的第一目标实体属于人物实体类别,目标三元组数据中的第二目标实体属于预设实体类别之一,参考值用于表征:第一目标实体和第二目标实体之间关联关系的准确性;
基于至少一条目标三元组数据各自的参考值以及多个三元组数据,生成档案编研数据。
根据本公开的实施例,计算目标三元组数据的参考值包括:
确定与目标三元组数据关联的目标指标的指标值和指标权重,其中目标指标包括以下至少之一:第一实体指标、第二实体指标、全局命中率指标,其中,第一实体指标与第一目标实体的属性关联,第二实体指标与第二目标实体的属性关联,全局命中率指标与第一目标实体和第二目标实体同时关联;
根据与目标三元组数据关联的目标指标的指标值和指标权重,计算得到目标三元组数据的参考值。
根据本公开的实施例,其中,确定与目标三元组数据关联的全局命中率指标的指标值包括:
确定目标三元组数据在原始档案数据文件中的第一引用次数;
确定多个三元组数据中的至少一个关联数据分别在原始档案数据文件中的第二引用次数,其中关联数据与目标三元组数据中的人物名称相同,且关联数据中的第二实体与目标三元组数据中的第二目标实体属于同一实体类别;
计算第一引用次数与至少一个第二引用次数之和的比值,以得到全局命中率指标的指标值。
根据本公开的实施例,其中,确定与目标三元组数据关联的第一实体指标的指标值包括:
从原始档案数据文件中抽取第一目标实体的属性值,其中第一目标实体的属性值包括与第一目标实体对应的人物职级;
根据第一预设打分规则,确定与第一目标实体的属性值对应的分数,作为第一实体指标的指标值。
根据本公开的实施例,其中,确定与目标三元组数据关联的第二实体指标的指标值包括:
从原始档案数据文件中抽取第二目标实体的属性值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司;建信金融科技有限责任公司,未经中国建设银行股份有限公司;建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310006058.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双氟磺酰亚胺的制备方法
- 下一篇:一种可以消除翻转不稳定的上摆开合辊道
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置