[发明专利]文档的处理方法和装置、处理器及电子设备在审
申请号: | 202210543138.0 | 申请日: | 2022-05-18 |
公开(公告)号: | CN114840735A | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 吴琳琳;陈永录;王静;赵燕子 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/93 | 分类号: | G06F16/93;G06F16/28;G06F16/2453;G06F16/22 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周春枚 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 处理 方法 装置 处理器 电子设备 | ||
本申请公开了一种文档的处理方法和装置、处理器及电子设备,涉及金融科技领域。该方法包括:获取目标对象输入的第一目标文档的内容信息和每个待匹配文档对应的第一目标哈希值;对所述第一目标文档的内容信息进行处理,得到第二目标哈希值;分别依据每个第一目标哈希值和所述第二目标哈希值进行计算,得到多个汉明距离;依据所述多个汉明距离和第一数据库,确定第二目标文档,并将所述第二目标文档反馈至所述目标对象,其中,所述第一数据库中存储有多个待匹配文档的存储路径。通过本申请,解决了相关技术中在进行文档管理时,由于文档数量多,导致搜索文档的效率比较低的问题。
技术领域
本申请涉及金融科技领域,具体而言,涉及一种文档的处理方法和装置、处理器及电子设备。
背景技术
随着信息化技术的发展,越来越多的信息文档被存储到存储介质上,虽然文档数量增长的很快,但是通过数据库的相关技术,计算机能够可以从庞大的文档库中准确地检索出符合条件(例如,文档的名称等)的文档。但是在进行文档管理时,由于文档数量多,存在搜索文档的效率比较低的问题。
针对相关技术中在进行文档管理时,由于文档数量多,导致搜索文档的效率比较低的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种文档的处理方法和装置、处理器及电子设备,以解决相关技术中在进行文档管理时,由于文档数量多,导致搜索文档的效率比较低的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种文档的处理方法。该方法包括:获取目标对象输入的第一目标文档的内容信息和每个待匹配文档对应的第一目标哈希值;对所述第一目标文档的内容信息进行处理,得到第二目标哈希值;分别依据每个第一目标哈希值和所述第二目标哈希值进行计算,得到多个汉明距离;依据所述多个汉明距离和第一数据库,确定第二目标文档,并将所述第二目标文档反馈至所述目标对象,其中,所述第一数据库中存储有多个待匹配文档的存储路径。
进一步地,对所述第一目标文档的内容信息进行处理,得到第二目标哈希值包括:通过第一预设算法对所述第一目标文档的内容信息进行信息抽取,得到目标关键信息;通过第二预设算法对所述目标关键信息进行处理,得到所述第二目标哈希值。
进一步地,通过第一预设算法对所述第一目标文档的内容信息进行信息抽取,得到目标关键信息包括:将所述第一目标文档的内容信息进行分割,得到多个组成单元;依据所述组成单元,构建目标图模型;依据所述目标图模型,得到所述目标关键信息。
进一步地,依据所述目标图模型,得到所述目标关键信息包括:依据所述目标图模型,对所述组成单元进行排序处理,得到排序结果;依据所述排序结果,得到所述目标关键信息。
进一步地,通过第二预设算法对所述目标关键信息进行处理,得到所述第二目标哈希值包括:将所述目标关键信息转换为多个目标特征向量,并为所述目标特征向量设置目标权重值;对所述目标特征向量进行哈希计算,得到初始哈希值;依据所述目标权重值对所述初始哈希值进行加权处理,得到多个初始序列串;对所述多个初始序列串进行叠加处理,得到目标序列串;对所述目标序列串进行降维处理,得到所述第二目标哈希值。
进一步地,依据所述汉明距离和第一数据库,确定第二目标文档,并将所述第二目标文档反馈至所述目标对象包括:判断所述汉明距离是否小于预设数值;若所述汉明距离小于所述预设数值,则将所述汉明距离小于所述预设数值的待匹配文档作为所述第二目标文档;依据所述第一数据库,获取所述第二目标文档的存储路径;依据所述存储路径,获取所述第二目标文档,并将所述第二目标文档反馈至所述目标对象。
进一步地,在获取目标对象输入的第一目标文档的内容信息和每个待匹配文档对应的第一目标哈希值之前,所述方法还包括:对每个待匹配文档进行信息处理,得到所述每个待匹配文档对应的信息摘要;以所述信息摘要为键,以所述每个待匹配文档的存储路径为值,组成键值对;将所述键值对存储至所述第一数据库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210543138.0/2.html,转载请声明来源钻瓜专利网。