[发明专利]一种金融领域的大数据比对方法及系统在审
申请号: | 202211093098.0 | 申请日: | 2022-09-08 |
公开(公告)号: | CN115587584A | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 李佳丽;张同虎 | 申请(专利权)人: | 建信金融科技有限责任公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F16/248;G06Q40/02 |
代理公司: | 北京市兰台律师事务所 11354 | 代理人: | 张峰 |
地址: | 200120 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 金融 领域 数据 方法 系统 | ||
本发明涉及计算机技术领域,尤其涉及一种金融领域的大数据比对方法及系统,所述方法包括:获取第一数据源数据和第二数据源数据,通过预设的数据卸数规则进行预处理;根据数据类型和内容分块存储,得到预设数量的对等的分块区域,为每对对等的分块区域分配相同的标识;将具有相同标识的第一数据源数据和第二数据源数据的文件块内容切割为字段,并提取关键词;根据预设的映射规则,将具有相同标识的第一数据源数据和第二数据源数据的文件块内的所有关键词进行比对,确定相对应的目标库表单元;根据预设的比对规则,将相对应的目标库表单元的数据内容进行比对;获得比对结果。该方法用于解决系统重构过程中的新老系统海量数据比对所带来的种种问题。
技术领域
本发明涉及计算机技术领域,尤其涉及一种金融领域的大数据比对方法及系统。
背景技术
银行业务由于涉及到账务金钱,要求数据必须准确,对系统运行的安全性和稳定性要求极高。因此银行业务的软件系统具有系统复杂度高、功能升级容错率低的特点。
近年来,随着对于用户体验、新业务发展、自主研发核心技术等需求的提升,银行业开展了大规模的业务流程改造和软件系统重构升级的工作,其中,针对系统重构、软硬件替代等大型改造工程,改造前后的基础数据比对是保障系统稳定运行、产品质量的必要环节。实际运行中,银行业务的数据具有数据量大、新老数据格式不统一、映射规则复杂等特点,在实施周期受限的情况下,人工进行大量数据的比对工作效率很低,逐条比对也容易出纰漏。尤其针对系统重构的新老系统海量数据比对的场景,面对数据可能存在的数据源不同、格式差异、比对映射规则复杂等问题,迫切需要一种通用的流程解决办法。
发明内容
为解决现有技术的不足,本发明提出一种金融领域的大数据比对方法及系统,用于系统重构过程中的新老系统海量数据比对的场景,以解决数据源不同、格式差异、比对映射规则复杂带来的数据比对困难的问题。
为实现以上目的,本发明所采用的技术方案包括:
本发明第一个方面,公开了一种金融领域的大数据比对方法,包括以下步骤:
获取第一数据源数据和第二数据源数据,通过预设的数据卸数规则分别进行预处理;
根据数据类型和内容分别对第一数据源数据和第二数据源数据分块存储,生成预设数量的第一数据源数据的文件块和第二数据源数据的文件块,且第一数据源数据的文件块和第二数据源数据的文件块相互匹配对等,为每对对等的第一数据源数据的文件块和第二数据源数据的文件块分配相同的标识;
将具有相同标识的第一数据源数据和第二数据源数据的文件块内容分别切割为字段,并提取关键词;
根据预设的映射规则,将具有相同标识的第一数据源数据和第二数据源数据的文件块内的所有关键词进行比对,确定相对应的目标库表单元;
根据预设的比对规则,将相对应的目标库表单元的数据内容进行比对,获得第一数据源数据和第二数据源数据的比对结果并进行保存;
通过可视化窗口展示比对结果。
进一步地,通过预设的数据卸数规则分别进行预处理包括消除数据的格式差异及精度差异。
进一步地,所述预设的映射规则,包括:构建映射关联词库,设置映射关联词将第一数据源和第二数据源中相对应的关键词进行关联。
进一步地,所述根据预设的比对规则,将相对应的目标库表单元的数据内容进行比对,包括:将相对应的目标库表单元的字段进行一一比对。
进一步地,所述关键词包括客户编号、客户身份信息、数据金额类型及币种符号中的一种或几种。
进一步地,所述比对规则配置文件设置为xml格式。
进一步地,所述通过可视化窗口展示比对结果包括识别差异字段并进行标记,在浏览器界面进行清晰展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于建信金融科技有限责任公司,未经建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211093098.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置