[发明专利]一种文档分类方法、装置、设备及存储介质有效
申请号: | 202210041761.6 | 申请日: | 2022-01-14 |
公开(公告)号: | CN114429637B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 李煜林;曹健健;钦夏孟;章成全;姚锟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V10/80;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 孟维娜;马敬 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文档 分类 方法 装置 设备 存储 介质 | ||
本公开提供了一种文档分类方法、装置、设备及存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于OCR等场景。具体实现方案为:获得待分类文档的图像;提取所述图像的图像特征,并对所述图像进行文本检测,得到所述图像中的文本以及文本位置信息;获得所得文本的文本特征;按照各文本特征所对应文本的文本位置信息,将各文本特征融合至所述图像特征,得到融合特征;基于所述融合特征,对所述待分类文档进行分类。应用本公开实施例提供的方案,能够实现对文档的分类。
技术领域
本公开涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于OCR(Optical Character Recognition,光学字符识别)等场景。
背景技术
在自动化办公场景中,一般会涉及多种不同类型的文档,针对每种类型的文档,往往需要进行不同的处理。例如,在差旅报销场景中,可能会涉及增值税发票、出租车票、火车票、行程单等票据文档,每种票据文档的核验方式不相同;在病案分析场景中,可能会存在病例单、处方单、病案首页、检查报告等病案文档,每种病案文档的分析方式不同。
鉴于上述情况,需要提供一种文档分类的方法,对文档进行分类,以按照分类结果准确的对文档进行处理。
发明内容
本公开提供了一种文档分类方法、装置、设备及存储介质。
根据本公开的一方面,提供了一种文档分类方法,包括:
获得待分类文档的图像;
提取所述图像的图像特征,并对所述图像进行文本检测,得到所述图像中的文本以及文本位置信息;
获得所得文本的文本特征;
按照各文本特征所对应文本的文本位置信息,将各文本特征融合至所述图像特征,得到融合特征;
基于所述融合特征,对所述待分类文档进行分类。
根据本公开的另一方面,提供了一种文档分类装置,包括:
图像获得模块,用于获得待分类文档的图像;
图像特征提取模块,用于提取所述图像的图像特征;
文本检测模块,用于对所述图像进行文本检测,得到所述图像中的文本以及文本位置信息;
文本特征获得模块,用于获得所得文本的文本特征;
特征融合模块,用于按照各文本特征所对应文本的文本位置信息,将各文本特征融合至所述图像特征,得到融合特征;
文档分类模块,用于基于所述融合特征,对所述待分类文档进行分类。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述文档分类方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述文档分类方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述文档分类方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210041761.6/2.html,转载请声明来源钻瓜专利网。