[发明专利]文本分离方法、装置、电子设备和存储介质在审
申请号: | 202210249247.1 | 申请日: | 2022-03-14 |
公开(公告)号: | CN114638957A | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 魏永强;胡殿明;刘雨亮 | 申请(专利权)人: | 北京感易智能科技有限公司 |
主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 杨明月 |
地址: | 102425 北京市房山*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分离 方法 装置 电子设备 存储 介质 | ||
本发明提供一种文本分离方法、装置、电子设备和存储介质,其中方法包括:确定待分离的重叠文本图像;将重叠文本图像输入至文本分离模型,得到文本分离模型输出的文本分离图像;文本分离模型基于样本重叠文本图像,以及样本重叠文本图像的样本文本分离图像,联合判别模型进行对抗训练得到,判别模型用于区分预测文本分离图像与样本文本分离图像,预测文本分离图像是文本分离模型基于样本重叠文本图像确定的,引入生成和对抗机制训练文本分离模型,能够保证其对于重叠文本图像的文本分离能力,克服了传统方案无法实现重叠文本分离的缺陷,在实现重叠文本分离的同时,保证了文本分离图像的自然度和逼真度,极大程度上提高了文本分离图像的图像质量。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种文本分离方法、装置、电子设备和存储介质。
背景技术
在OCR(Optical Character Recognition,光学字符识别)票据文字识别场景中,由于票据打印会存在错行的情况,而错行现象会导致票据中存在大量的文本重叠,即票据本身的固定文本和后期打印的印刷文本之间的重叠,而通过图像处理方法可实现重叠文本的分离。
传统方案中,主要是对文本像素和背景像素进行区分,通过加强文本像素,实现文本图像二值化,但是,上述通过像素值的大小区分文本区域和背景区域的方式,仅能实现重叠图像中文本区域和背景区域分离,而无法实现对文本区域中的重叠文本进行分离;并且,对于背景较为复杂的自然场景,其分离效果不佳。
发明内容
本发明提供一种文本分离方法、装置、电子设备和存储介质,用以解决现有技术中仅能针对文本区域和背景区域进行区分,无法实现文本区域中重叠文本的分离,从而导致后续文字识别准确度低下的缺陷。
本发明提供一种文本分离方法,包括:
确定待分离的重叠文本图像;
将所述重叠文本图像输入至文本分离模型,得到所述文本分离模型输出的文本分离图像;
所述文本分离模型基于样本重叠文本图像,以及所述样本重叠文本图像的样本文本分离图像,联合判别模型进行对抗训练得到,所述判别模型用于区分预测文本分离图像与所述样本文本分离图像,所述预测文本分离图像是所述文本分离模型基于所述样本重叠文本图像确定的。
根据本发明提供的一种文本分离方法,所述将所述重叠文本图像输入至文本分离模型,得到所述文本分离模型输出的文本分离图像,包括:
将所述重叠文本图像输入至所述文本分离模型中的特征卷积网络,得到所述特征卷积网络输出的所述重叠文本图像的图像特征;
将所述图像特征输入至所述文本分离模型中的固定文本生成网络,得到所述固定文本生成网络输出的固定文本图像;
将所述图像特征输入至所述文本分离模型中的印刷文本生成网络,得到所述印刷文本生成网络输出的印刷文本图像,所述固定文本图像和所述印刷文本图像构成所述文本分离图像。
根据本发明提供的一种文本分离方法,所述将所述图像特征输入至所述文本分离模型中的印刷文本生成网络,得到所述印刷文本生成网络输出的印刷文本图像,包括:
将所述图像特征分别输入至所述印刷文本生成网络下的印刷文本生成分支和印刷文本二值图生成分支,得到所述印刷文本生成分支输出的初始印刷文本图像,以及所述印刷文本二值图生成分支输出的印刷文本二值图;
基于所述印刷文本二值图,以及所述初始印刷文本图像,确定所述印刷文本图像。
根据本发明提供的一种文本分离方法,所述判别模型包括固定文本判别分支,印刷文本判别分支以及印刷文本二值图判别分支;
所述固定文本判别分支用于判别固定文本图像的真伪;
所述印刷文本判别分支用于判别初始印刷文本图像的真伪;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京感易智能科技有限公司,未经北京感易智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210249247.1/2.html,转载请声明来源钻瓜专利网。