[发明专利]文本图像分类方法及装置在审
申请号: | 202010629999.1 | 申请日: | 2020-07-03 |
公开(公告)号: | CN111797922A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 朱兴杰;刘岩 | 申请(专利权)人: | 泰康保险集团股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/40;G06K9/46 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王天尧;吴学锋 |
地址: | 100031 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 图像 分类 方法 装置 | ||
本发明提供了一种文本图像分类方法及装置,该方法包括:对文本图像进行文本行检测,获得多个文本行的内容;根据文本行的宽度信息,从多个文本行中,抽取满足设定长度和数量要求的文本行的内容;基于满足设定长度和数量要求的文本行的内容,提取满足设定长度和数量要求的文本行的特征向量;基于所述特征向量,对多个文本行进行分类,得到文本图像的类别向量及类别向量中每个类别对应的概率;确定概率最大的类别为文本图像的类别。本发明可以对文本图像进行分类,准确率高。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种文本图像分类方法及装置。
背景技术
随着人工智能技术的高速发展,平板电脑、智能手机等配备数字摄像头的手持终端设备的推广普及,基于数字图像资料的业务办理数量急剧增加。在保险领域,这些数字图像覆盖了住院医疗票据,身份证银行卡等大量有用的信息。然而,对于收集到的数字图像通常需要工作人员人工审核查看资料是否齐全,对于客户的误传和漏传现象不能及时的反馈。而这个过程需要浪费大量的人力物力进行沟通协调,既影响工作人员的工作效率,也拉长了客户办理业务的时长,对客户体验非常差。为解决上述问题,其中一种有效的方法是先对客户上次的图像进行分类,现有的图像分类技术多用于类间差异明显,类内差异不大的场景,例如:身份证、银行卡等卡证类的分类,同一个类型一般情况下差距不大,而不同类别间的差距就非常明显,现有的深度学习技术,能够很好的解决这类问题,并且检测准确率和时效性都能满足业务场景的需求。但是对于医疗影像等文本类图像,由于类内差异小,很多类型的判断通常都需要根据图像的内容进行分析,例如:费用清单,结算单等。对于这类文本图像,现有的图像分类方法不能精准的解决其分类问题。
发明内容
本发明实施例提出一种文本图像分类方法,用以对文本图像进行分类,准确率高,该方法包括:
对文本图像进行文本行检测,获得多个文本行的内容;
根据文本行的宽度信息,从多个文本行中,抽取满足设定长度和数量要求的文本行的内容;
基于满足设定长度和数量要求的文本行的内容,提取满足设定长度和数量要求的文本行的特征向量;
基于所述特征向量,对多个文本行进行分类,得到文本图像的类别向量及类别向量中每个类别对应的概率;
确定概率最大的类别为文本图像的类别。
本发明实施例提出一种文本图像分类装置,用以对文本图像进行分类,准确率高,该装置包括:
文本行检测模块,用于对文本图像进行文本行检测,获得多个文本行的内容;
内容抽取模块,用于根据文本行的宽度信息,从多个文本行中,抽取满足设定长度和数量要求的文本行的内容;
特征向量提取模块,用于基于满足设定长度和数量要求的文本行的内容,提取满足设定长度和数量要求的文本行的特征向量;
分类模块,用于基于所述特征向量,对多个文本行进行分类,得到文本图像的类别向量及类别向量中每个类别对应的概率;
类别确定模块,用于确定概率最大的类别为文本图像的类别。
本发明实施例还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述文本图像分类方法。
本发明实施例还提出了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述文本图像分类方法的计算机程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司,未经泰康保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010629999.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序