[发明专利]文件解析方法、装置、电子设备和计算机可读介质有效
申请号: | 202110957938.2 | 申请日: | 2021-08-20 |
公开(公告)号: | CN113407613B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 王丽君;丁扬;蔡敬东;范鹏展;陈广;孟贤 | 申请(专利权)人: | 北京国电通网络技术有限公司;国网物资有限公司;国网信息通信产业集团有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25 |
代理公司: | 北京唯智勤实知识产权代理事务所(普通合伙) 11557 | 代理人: | 陈佳 |
地址: | 100032 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 解析 方法 装置 电子设备 计算机 可读 介质 | ||
1.一种文件解析方法,包括:
获取待解析文件集合;
对所述待解析文件集合中的每个待解析文件进行格式转换,以生成结构化待解析信息,得到结构化待解析信息集合,其中,所述结构化待解析信息集合中的结构化待解析信息包括:第一总价值、第二总价值、第一单位价值和第二单位价值;
对所述结构化待解析信息集合中的每个结构化待解析信息进行解析,以生成待入库信息组,得到待入库信息组集合;
确定所述待入库信息组集合中每个待入库信息组对应的入库优先级,得到入库优先级集合;
根据所述入库优先级集合,将所述待入库信息组集合中的待入库信息组存储至目标数据库,
其中,所述确定所述待入库信息组集合中每个待入库信息组对应的入库优先级,包括:
基于所述结构化待解析信息集合和所述待入库信息组对应的结构化待解析信息包括的第一总价值、第二总价值、第一单位价值和第二单位价值,通过以下公式,确定所述入库优先级:
其中,表示第一总价值评分值,表示序号,表示所述待入库信息组集合中的待入库信息组的数量,表示所述待入库信息组集合中的待入库信息组对应的结构化待解析信息包括的第一总价值,表示所述待入库信息组集合中第个待入库信息组中对应的结构化待解析信息包括的第一总价值,表示所述待入库信息组集合中的各个待入库信息组对应的结构化待解析信息包括的第一总价值,表示所述待入库信息组集合中的各个待入库信息组对应的结构化待解析信息包括的第一总价值中的最小值,表示所述待入库信息组对应的结构化待解析信息包括的第一总价值,表示第二总价值评分值,表示所述待入库信息组集合中的待入库信息组对应的结构化待解析信息包括的第二总价值,表示所述待入库信息组集合中第个待入库信息组对应的结构化待解析信息包括的第二总价值,表示所述待入库信息组集合中的各个待入库信息组对应的结构化待解析信息包括的第二总价值,表示所述待入库信息组集合中的各个待入库信息组对应的结构化待解析信息包括的第二总价值中的最大值,表示所述待入库信息组对应的结构化待解析信息包括的第二总价值,表示第一单位价值评分值,表示所述待入库信息组集合中的待入库信息组对应的结构化待解析信息包括的第一单位价值,表示所述待入库信息组集合中第个待入库信息组对应的结构化待解析信息包括的第一单位价值,表示所述待入库信息组集合中的各个待入库信息组对应的结构化待解析信息包括的第一单位价值,表示所述待入库信息组集合中的各个待入库信息组对应的结构化待解析信息包括的第一单位价值中的最小值,表示所述待入库信息组对应的结构化待解析信息包括的第一单位价值,表示所述待入库信息组的第二单位价值评分值,表示所述待入库信息组集合中的待入库信息组对应的结构化待解析信息包括的第二单位价值,表示所述待入库信息组集合中第个待入库信息组对应的结构化待解析信息包括的第二单位价值,表示所述待入库信息组集合中的各个待入库信息组对应的结构化待解析信息包括的第二单位价值,表示所述待入库信息组集合中的各个待入库信息组对应的结构化待解析信息包括的第二单位价值中的最大值,表示所述待入库信息组对应的结构化待解析信息包括的第二单位价值,表示所述待入库信息组的入库优先级,表示第一预设权重,的取值范围为,表示第二预设权重,的取值范围为,表示第三预设权重,的取值范围为,表示第四预设权重,的取值范围为。
2.根据权利要求1所述的方法,其中,所述结构化待解析信息集合中的结构化待解析信息包括:第一类型入库信息、第二类型入库信息、第三类型入库信息和第四类型入库信息;以及
所述对所述结构化待解析信息集合中的每个结构化待解析信息进行解析,以生成待入库信息组,包括:
响应于确定目标文件解析类型组中存在第一文件解析类型,提取所述结构化待解析信息中的第一类型入库信息作为待入库信息,其中,所述目标文件解析类型组为所述结构化待解析信息对应的文件解析类型组。
3.根据权利要求2所述的方法,其中,所述对所述结构化待解析信息集合中的每个结构化待解析信息进行解析,以生成待入库信息组,还包括:
响应于确定所述目标文件解析类型组中存在第二文件解析类型,提取所述结构化待解析信息中的第二类型入库信息作为待入库信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国电通网络技术有限公司;国网物资有限公司;国网信息通信产业集团有限公司,未经北京国电通网络技术有限公司;国网物资有限公司;国网信息通信产业集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110957938.2/1.html,转载请声明来源钻瓜专利网。