[发明专利]一种印章去除方法、装置、设备及存储介质有效
申请号: | 202210634450.0 | 申请日: | 2022-06-07 |
公开(公告)号: | CN114936965B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 刘春辉;袁野 | 申请(专利权)人: | 上海弘玑信息技术有限公司 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06T5/00 |
代理公司: | 江苏瑞途律师事务所 32346 | 代理人: | 李维朝 |
地址: | 200000 上海市闵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 印章 去除 方法 装置 设备 存储 介质 | ||
本发明公开一种印章去除方法、装置、设备及存储介质,属于计算机图像处理技术领域。针对现有技术中存在的现有文件的印章去除方法准确率不高或去除效率不高等问题,本发明通过对原始图像各像素点RGB值计算,通过像素点的RGB值,确定印章像素点及背景像素点,使用背景像素点替换印章像素点,实现印章的去除;本发明印章去除方法可以准确区分纯印章部分、文字部分、印章文字重叠部分,不仅能够有效地去除印章,同时还能保留被印章覆盖的文字信息,印章去除准确率高,计算方法简单易于实现,适合广泛推广。
技术领域
本发明涉及计算机图像处理技术领域,更具体地说,涉及一种印章去除方法、装置、设备及存储介质。
背景技术
近几年,随着计算机技术的发展,机器人流程自动化(Robotic ProcessAutomation,RPA)也逐渐的发展起来。机器人流程自动化是指使用软件机器人,自动执行通常由知识工作者执行的高度重复性的日常任务。机器人流程自动化能够减少繁复的人力劳动,自动处理表单、票据、合同等文档内容。机器人流程自动化机器人拓展了自动化平台的价值,它可以更快地完成任务,使员工能够去从事更高价值的工作。
有一种较常出现的应用场景,是在进行文档处理时,文档中会出现一些印章,包括公章、发票章、人名章等。这些印章的存在往往会对文档中的一些重要内容产生遮挡,从而影响光学字符识别对文档内容中识别,进而影响机器人流程自动化的结果。传统技术的印章去除方法对印章和字符重叠的部分,其去除效果不佳。
现有技术中印章的去除一般是通过识别图像中的红色的像素点,通过算法去除文档图片中红色像素点,但是该方法不够精准,对于文档中印章和文字重叠的部分会造成内容的错误去除,进而导致文档信息的识别错误。也有一些印章去除方法通过训练网络对有印章图像和无印象图像进行判别和分类,学习有印章和无印章图像的特征,进而区分两类图像,生成无印章图像,从而实现对印章图像中印章的去除,但是此类方法需要构建额外的网络进行学习,计算复杂,计算效率不高。
发明内容
1.要解决的技术问题
针对现有技术中存在的现有文件的印章去除方法准确率不高或去除效率不高等问题,本发明提供一种印章去除方法、装置、设备及存储介质,可以正确区分纯印章部分、文字部分、印章文字重叠部分,不仅能够有效地去除印章,同时还能保留被印章覆盖的文字信息,计算方式简单容易实现,计算效率高。
2.技术方案
本发明的目的通过以下技术方案实现。
第一方面,本发明公开一种印章去除方法,通过获取图片每个像素点的RGB值,确认图片的印章像素点和背景像素点,使用背景像素点替换印章像素点,实现印章去除。
更进一步的,包括以下步骤:
步骤100:获取所述每个像素点的RGB值,确定印章可能存在的区域,设为集合S;
步骤200:根据所述集合S确认目标像素点集合A和背景像素点集合P;
步骤300:设定阈值确认目标像素点集合A中的印章像素点集合A1;根据所述背景像素点集合P确定平均背景色RGB值,使用所述平均背景色RGB值替代所述印章像素点集合A1中的像素点RGB值,得到印章去除后的文档图片。
更进一步的,根据像素点的RGB值判断所述像素点是否为所述目标像素点,包括:
若印章为红色,当所述像素点的RGB中红色通道值大于绿色通道数值及蓝色通道数值,该像素点为目标像素点;
若印章为蓝色,当所述像素点的RGB中蓝色通道值大于绿色通道数值及红色通道数值,该像素点为目标像素点;
若印章为绿色,当所述像素点的RGB中绿色通道值大于红色通道数值及蓝色通道数值,该像素点为目标像素点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海弘玑信息技术有限公司,未经上海弘玑信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210634450.0/2.html,转载请声明来源钻瓜专利网。