[发明专利]一种财务数据转换成评估数据规范化的方法在审
申请号: | 202010019361.6 | 申请日: | 2020-01-08 |
公开(公告)号: | CN111258953A | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 李博;何平;李媛媛 | 申请(专利权)人: | 中联财联网科技有限公司 |
主分类号: | G06F16/11 | 分类号: | G06F16/11;G06F40/258;G06F40/151;G06F40/186;G06N20/00 |
代理公司: | 北京劲创知识产权代理事务所(普通合伙) 11589 | 代理人: | 徐家升 |
地址: | 100032 北京市西城区复兴*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 财务数据 转换 评估 数据 规范化 方法 | ||
1.一种财务数据转换成评估数据规范化的方法,包括以下步骤:
S1、接收待转换的excel模板数据文件;
S2、读取接收到的模板文件中的数据,利用匹配规则引擎针对每行数据的内容,进行表头行和具体数据行的分类;
S3、利用匹配规则引擎针对表头行的内容,进行字段含义的匹配,用来对应标准模板中的预设评估所需字段;
S4、利用匹配规则引擎针对数据行的内容,进行科目编号、科目名称的匹配,用来对应评估模板所需字段;
S5、根据匹配到的字段,进行多种数据格式单位的处理;
S6、匹配结果在浏览器web页面进行展示,可进行人为调整;
S7、将最终匹配完毕的数据进行数据库持久化存储,用以提供导出评估数据模板;
其中,所述待转换的excel模板数据文件支持xls以及xlsx格式类型;
所述待转换的excel模板数据文件支持主流的财务软件系统导出的余额表、明细账、资产台账,不同的字段名称以及格式;
所述匹配规则引擎,通过读取的导入数据前两行的内容来确定该模板是一行标题还是两行标题,用以区分标题和具体数据;
针对表头行的内容,根据预设的匹配资源库进行匹配,包括精确匹配以及模糊匹配;
针对数据行的内容,进行科目编号、科目名称的匹配,用来对应评估模板所需字段;
所述匹配到的字段格式处理包括科目编号、科目名称以及涉及到的金额等字段,以达到统一格式处理;
所述页面展示,人为干预调整匹配关系,可以进行匹配引擎的升级完善;
根据匹配完成的结果,进行格式化数据的存储,并通过业务逻辑导出提供评估使用的数据模板。
2.如权利要求1所述方法,其特征在于,所述S2涉及的利用匹配规则引擎,针对表头行和具体数据行的分类操作通过以下步骤实现:
S2.1、根据解析的导入数据前两行内容,来适配是单行表头还是双行表头;
S2.2、单行表头,第一行各个列的数据内容都是针对属性的描述文字;
S2.3、双行表头,第一行同单行表头,第二行科目编号和科目名称列内容必定为空(根据excel合并单元格处理);
S3涉及的利用匹配规则引擎,针对表头行的内容,进行字段含义的匹配,用来对应标准模板中的预设评估所需字段,通过以下步骤实现:
S3.1、根据表头每个单元格的内容,通过不断完善的预设匹配池中进行精确匹配;
S3.2、匹配到的标题列用自定义规范化的标识code进行标注;
S3.3、将数据组装成规范化的数据结构进行后续使用;
S4涉及的利用匹配规则引擎,针对数据行的内容,进行科目编号、科目名称的匹配,用来对应评估模板所需字段,通过以下步骤实现:
S4.1、科目编号列进行层级处理,从一级科目进行逐级匹配,区分出来每个科目的父级科目和子集科目;
S4.2、科目名称列根据匹配到的一级科目进行子集科目的逐级匹配;
S4.3、科目名称列根据匹配到的一级科目的科目编号重新执行科目编号的匹配规则进行第三次匹配。
3.如权利要求1所述方法,其特征在于,所述S2、S3、S4涉及的匹配规则引擎通过Hbase+Storm+Spark组合完成:
利用Hbase,将非结构化的自动匹配、手动匹配日志文件数据进行实时存储,为后续模板适配计算提供高效的读写性能;
利用分布式流计算引擎Storm,对每个节点实现一个基本的计算过程,数据项在互相连接的网络节点中流进流出,动态处理实时大量生成的自动解析数据日志以及人为干预处理日志,及时的对导入的模板进行适配解析,进行模板适配自学习,不断完善扩充支持的模板类型;
再利用Spark,先汇聚不同任务生成的批量数据,然后进行数据全集的全面计算处理,进行模板解析适配的整体完善;
在保证了用户每次导入任务实时准确处理的同时,又及时的对模板适配进行了扩充完善,不断提升自动识别和转换率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中联财联网科技有限公司,未经中联财联网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010019361.6/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置