[发明专利]文档的处理方法和装置、处理器及电子设备在审
申请号: | 202210543138.0 | 申请日: | 2022-05-18 |
公开(公告)号: | CN114840735A | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 吴琳琳;陈永录;王静;赵燕子 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/93 | 分类号: | G06F16/93;G06F16/28;G06F16/2453;G06F16/22 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周春枚 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 处理 方法 装置 处理器 电子设备 | ||
1.一种文档的处理方法,其特征在于,包括:
获取目标对象输入的第一目标文档的内容信息和每个待匹配文档对应的第一目标哈希值;
对所述第一目标文档的内容信息进行处理,得到第二目标哈希值;
分别依据每个第一目标哈希值和所述第二目标哈希值进行计算,得到多个汉明距离;
依据所述多个汉明距离和第一数据库,确定第二目标文档,并将所述第二目标文档反馈至所述目标对象,其中,所述第一数据库中存储有多个待匹配文档的存储路径。
2.根据权利要求1所述的方法,其特征在于,对所述第一目标文档的内容信息进行处理,得到第二目标哈希值包括:
通过第一预设算法对所述第一目标文档的内容信息进行信息抽取,得到目标关键信息;
通过第二预设算法对所述目标关键信息进行处理,得到所述第二目标哈希值。
3.根据权利要求2所述的方法,其特征在于,通过第一预设算法对所述第一目标文档的内容信息进行信息抽取,得到目标关键信息包括:
将所述第一目标文档的内容信息进行分割,得到多个组成单元;
依据所述组成单元,构建目标图模型;
依据所述目标图模型,得到所述目标关键信息。
4.根据权利要求3所述的方法,其特征在于,依据所述目标图模型,得到所述目标关键信息包括:
依据所述目标图模型,对所述组成单元进行排序处理,得到排序结果;
依据所述排序结果,得到所述目标关键信息。
5.根据权利要求2所述的方法,其特征在于,通过第二预设算法对所述目标关键信息进行处理,得到所述第二目标哈希值包括:
将所述目标关键信息转换为多个目标特征向量,并为所述目标特征向量设置目标权重值;
对所述目标特征向量进行哈希计算,得到初始哈希值;
依据所述目标权重值对所述初始哈希值进行加权处理,得到多个初始序列串;
对所述多个初始序列串进行叠加处理,得到目标序列串;
对所述目标序列串进行降维处理,得到所述第二目标哈希值。
6.根据权利要求1所述的方法,其特征在于,依据所述汉明距离和第一数据库,确定第二目标文档,并将所述第二目标文档反馈至所述目标对象包括:
判断所述汉明距离是否小于预设数值;
若所述汉明距离小于所述预设数值,则将所述汉明距离小于所述预设数值的待匹配文档作为所述第二目标文档;
依据所述第一数据库,获取所述第二目标文档的存储路径;
依据所述存储路径,获取所述第二目标文档,并将所述第二目标文档反馈至所述目标对象。
7.根据权利要求1所述的方法,其特征在于,在获取目标对象输入的第一目标文档的内容信息和每个待匹配文档对应的第一目标哈希值之前,所述方法还包括:
对每个待匹配文档进行信息处理,得到所述每个待匹配文档对应的信息摘要;
以所述信息摘要为键,以所述每个待匹配文档的存储路径为值,组成键值对;
将所述键值对存储至所述第一数据库中。
8.一种文档的处理装置,其特征在于,包括:
获取单元,用于获取目标对象输入的第一目标文档的内容信息和每个待匹配文档对应的第一目标哈希值;
第一处理单元,用于对所述第一目标文档的内容信息进行处理,得到第二目标哈希值;
计算单元,用于分别依据每个第一目标哈希值和所述第二目标哈希值进行计算,得到多个汉明距离;
确定单元,用于依据所述多个汉明距离和第一数据库,确定第二目标文档,并将所述第二目标文档反馈至所述目标对象,其中,所述第一数据库中存储有多个待匹配文档的存储路径。
9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的文档的处理方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的文档的处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210543138.0/1.html,转载请声明来源钻瓜专利网。