[发明专利]一种文稿图像自适应多黑点检测去除方法在审

专利信息
申请号: 202310795156.2 申请日: 2023-06-29
公开(公告)号: CN116935402A 公开(公告)日: 2023-10-24
发明(设计)人: 石雁;李艳;李迪 申请(专利权)人: 永中软件股份有限公司
主分类号: G06V30/164 分类号: G06V30/164;G06V30/18;G06V30/162
代理公司: 苏州简理知识产权代理有限公司 32371 代理人: 杨瑞玲
地址: 214135 江苏省无锡市*** 国省代码: 江苏;32
权利要求书: 暂无信息 说明书: 暂无信息
摘要: 发明提供一种文稿图像自适应多黑点检测去除方法,包括如下步骤:S1,对读取的图像进行锐化处理,补偿图像中的文字轮廓,增强文字边缘及灰度跳变部分,使文字变得清晰,再依次进行图像灰度化和二值化处理,将图像转为黑白图;S2,对图像进行八连通域分析,将图像中具有相同像素值且相邻的像素找出来并标记,统计出图像中所有连通域以及它们的外接矩形坐标和像素个数;S3,对所有经连通域分析后的结果进行一个自适应阈值估计,自动估计出一个阈值作为去除黑点的自适应参数,小于此参数的黑点去除,大于此参数的黑点则保留。本发明具有能够快速、方便、精准的去除文稿图像中的黑点等优点。
搜索关键词: 一种 文稿 图像 自适应 黑点 检测 去除 方法
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于永中软件股份有限公司,未经永中软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202310795156.2/,转载请声明来源钻瓜专利网。

同类专利
  • 一种文稿图像自适应多黑点检测去除方法-202310795156.2
  • 石雁;李艳;李迪 - 永中软件股份有限公司
  • 2023-06-29 - 2023-10-24 - G06V30/164
  • 本发明提供一种文稿图像自适应多黑点检测去除方法,包括如下步骤:S1,对读取的图像进行锐化处理,补偿图像中的文字轮廓,增强文字边缘及灰度跳变部分,使文字变得清晰,再依次进行图像灰度化和二值化处理,将图像转为黑白图;S2,对图像进行八连通域分析,将图像中具有相同像素值且相邻的像素找出来并标记,统计出图像中所有连通域以及它们的外接矩形坐标和像素个数;S3,对所有经连通域分析后的结果进行一个自适应阈值估计,自动估计出一个阈值作为去除黑点的自适应参数,小于此参数的黑点去除,大于此参数的黑点则保留。本发明具有能够快速、方便、精准的去除文稿图像中的黑点等优点。
  • 商保审核方法、系统、终端及存储介质-202310930316.X
  • 柯先文;谢冠超 - 云知声智能科技股份有限公司
  • 2023-07-26 - 2023-10-20 - G06V30/164
  • 本发明提供了一种商保审核方法、系统、终端及存储介质,该方法包括:获取商保报案单据,并对所述商保报案单据进行文字识别,得到单据文字;对所述单据文字进行数据清洗,并对数据清洗后的所述单据文字进行数据转换,得到单据结构化信息;对所述单据结构化信息进行审核校对,并对审核校对后的所述单据结构化信息进行数据消减;根据数据消减后的所述单据结构化信息生成商保审核结果。本发明实施例,能自动对商保报案单据进行审核校对,无需采用人工的方式进行审核,提高了商标审核效率,降低了用户等待时间和服务成本。
  • 一种基于深度学习的业务会话风险处理方法-202310672882.5
  • 丁泓嘉;王政鑫;谭梓琦 - 北京东方海达网络科技有限责任公司
  • 2023-06-07 - 2023-10-10 - G06V30/164
  • 本发明涉及人工智能风险处理领域,尤其涉及一种基于深度学习的业务会话风险处理方法。所述方法包括以下步骤:获取业务会话数据;对业务会话数据进行数据预处理,从而生成标准业务会话数据;将标准业务会话数据进行会话文字段长检测处理,生成会话文字段数据;对会话文字段数据进行数据切割处理,生成会话文字数据;根据傅里叶变换对会话文字数据进行图像转化处理,得到会话文字图像数据;对会话文字图像数据进行边缘区域划分处理,从而生成文字图像网格;将文字图像网格进行图像去噪处理,生成降噪文字图像网格;本发明通过对业务会话进行智能风险识别处理,以实现基于深度学习的业务会话风险处理方法。
  • 一种基于GAN的任务分解式图像文档去噪方法-202310527839.X
  • 李巍豪;周炳诚;高翔;魏舒;许诺;潘新星;杨彬彬;黄登;陈运文;纪达麒 - 达而观信息科技(上海)有限公司
  • 2023-05-11 - 2023-09-26 - G06V30/164
  • 本发明公开了一种基于GAN的任务分解式图像文档去噪方法,采用基于条件GAN的DTNS算法,将图像格式文档的去噪过程分为发现干扰区域和消除干扰区域两部分;其中,发现干扰区域为在图像中找到以水印和印章为代表的所有噪声区域,消除干扰区域为去除所述噪声区域,将图像中的信息还原到加噪前的状态。本发明提出一种基于条件GAN的DTNS算法,通过将去噪任务分解为水印发现和水印去除两个部分,大大降低了直接通过GAN去除水印的任务难度,降低网络复杂度,并且通过在重合区域使用高维结构的特征空间中高斯采样,可以减缓重合区域的文字轮廓丢失现象,从而较好地去除文档图像中的噪声。
  • 一种VIN图像检测处理方法、装置、电子设备及存储介质-202310662480.7
  • 刘晓刚;方德浩;徐劲力;黄丰云;卢杰;蔡兰兰 - 武汉理工大学
  • 2023-06-05 - 2023-09-01 - G06V30/164
  • 本发明提供了一种VIN图像检测处理方法、装置、电子设备及计算机可读存储介质,包括:对初始照片进行直方图规定化处理,得到规定化图像;对规定化图像进行VIN粗定位区域检测,得到VIN粗定位区域的VIN粗区域图像;根据VIN粗区域图像,得到VIN最小外接矩形,根据VIN最小外接矩形对VIN粗区域图像进行裁剪,得到VIN精确区域图像;对VIN精确区域图像进行等比例还原。本发明对初始照片进行直方图规定化处理,去除初始照片中过亮的部分噪声,通过VIN粗定位区域的检测,得到增强图片对比度、过滤噪声强化边缘信息之后的VIN粗区域图像,然后进行VIN图像检测,得到VIN精确区域图像,提高检测结果的准确率。
  • 文档去噪方法、装置、设备和介质-202310525026.7
  • 张海轩 - 中国工商银行股份有限公司
  • 2023-05-10 - 2023-08-11 - G06V30/164
  • 本公开提供了一种文档去噪方法,可以应用于人工智能技术领域。该方法包括:基于编解码结构的融合网络模型,利用编码模块对输入的第一文档图像进行特征压缩;以及利用解码模块对编码模块的输出进行图像还原后输出第二文档图像,其中,第二文档图像用作光学字符识别系统的输入。其中,编码模块包括至少一个卷积层,在每个卷积层中利用区域生成网络在卷积层的输入特征图上通过滑动窗口产生搜索框,并对每个搜索框进行分类,分类包括冗余和不冗余两类;利用特征提取子网络对分类到不冗余的类别中的搜索框进行特征提取,得到卷积层的输出特征图。本公开还提供了一种文档去噪装置、设备、存储介质和程序产品。
  • 一种基于营业执照数据内容的数据分析处理方法及系统-202310525205.0
  • 朱怀安;叶祖焕;张昆;孙海鹏 - 湖南华菱电子商务有限公司
  • 2023-05-11 - 2023-08-11 - G06V30/164
  • 本发明涉及数据分析技术领域,尤其涉及一种基于营业执照数据内容的数据分析处理方法及系统。所述步骤包括以下步骤:获取营业执照的图像数据,对图像数据进行图像预处理,生成标准图像数据;对标准图像数据进行图像块核心及边缘区域划分处理,生成划分图像数据集;对划分图像数据集进行数据降噪处理,生成降噪图像数据;对降噪图像数据进行特征信息提取处理,生成图像文字数据;获取注册文字数据,对注册文字数据与图像文字数据进行文字比对检测处理,当注册文字数据与图像文字数据比对不一致时,生成商城注册错误信息。本发明通过对营业执照图像的文字进行识别检测及处理,以实现营业执照数据内容的快速检查及商家快速注册。
  • 基于二次卷积和外部注意力的图像去噪方法、装置及设备-202310316361.6
  • 江雪聪 - 中国工商银行股份有限公司
  • 2023-03-24 - 2023-07-07 - G06V30/164
  • 本说明书涉及人工智能技术领域,提供了一种基于二次卷积和外部注意力的图像去噪方法、装置及设备,该方法包括:接收待去噪处理的目标图像;使用多级二次卷积层按照下采样编码方式逐级提取所述目标图像的图像特征,并使用多级外部注意力模块逐级挖掘对应级图像特征中的纹理信息;使用多级二次反卷积层按照上采样解码方式对编码阶段最终输出的图像特征进行逐级解码,以重建去噪后的目标图像。通过本说明书实施例可以降低计算资源消耗的同时提升去噪图像质量,从而兼顾了图像去噪的精度和计算资源消耗。
  • 一种基于生成对抗网络的历史文档图像降噪方法及系统-202211141204.8
  • 徐昊;岳明哲;刁晓蕾;史大千;石立达 - 吉林大学
  • 2022-09-20 - 2023-06-16 - G06V30/164
  • 本申请公开了一种基于生成对抗网络的历史文档图像降噪方法及系统,获取历史文档图像,构建文字骨骼提取网络训练集和生成对抗网络训练集;基于文字骨骼提取网络训练集,构建文字骨骼提取网络,获得文字骨骼图像;基于生成对抗网络训练集和文字骨骼图像,构建生成对抗网络,获得图像降噪模型;训练图像降噪模型,基于训练好的图像降噪模型,获得历史文档噪声图像的降噪结果。解决了历史文档图像中对于复杂噪声的处理问题,使图像降噪质量得到显著提高,具有很强的利用价值。
  • 一种基于深度学习的文本图像去模糊方法-202211702749.1
  • 李剑波;王新元;黄进;荣鹏;冯义从;尹泽召;杨瑛玮 - 西南交通大学
  • 2022-12-28 - 2023-05-16 - G06V30/164
  • 本发明公开了一种基于深度学习的文本图像去模糊方法,涉及计算机图像识别领域,主要解决的问题是通过深度学习方式实现模糊的文本图像去模糊得到清晰的文本图像,包括以下步骤;步骤1:将成对的模糊‑清晰文本图像数据集输入深度残差神经网络中进行训练;步骤2:通过不断迭代训练,直到客观评价指标逐渐收敛,得到文本图像的去模糊模型;步骤3:将模糊的文本图像输入到深度残差神经网络,经过去模糊模型进行处理,得到对应的去模糊文本图像。
  • 一种仪表指针读数识别方法-202211549996.2
  • 郝国栋;靳鹏宇;翟德华;刘利强;宋伟帅;崔毅坚;郭凯;高波 - 山西科达自控股份有限公司;山西天科信息安全科技有限公司
  • 2022-12-05 - 2023-05-09 - G06V30/164
  • 本发明公开了一种仪表指针读数识别方法,属于仪表识别技术领域,具体包括:采集仪表图像,将仪表图像进行预处理,识别存在的条形区域,通过中值滤波获得直线方程,计算直线方程的交点,将交点集合的密度中心点设为轴心点;以轴心点为原点获得极坐标图像,对极坐标图像进行预处理,识别平行条形区域获得刻度线;识别仪表图像中字符的数值,极坐标变换后的字符中心点,将字符数值赋予距离最近的刻度线,将距离轴心点最近的像素点的角度设为刻度线角度;选取指针区域,根据指针区域在平行条形区域中的次序计算指针角度,遍历刻度线,将示数待定值集合的中值判定为指针示数;本发明实现了准确的指针读数识别。
  • 文本识别方法、装置、电子设备和存储介质-202211667597.6
  • 王凌云;郑玉玲;刘兆蓬;王梓凝;宋丹丹 - 成方金融科技有限公司
  • 2022-12-23 - 2023-04-18 - G06V30/164
  • 本发明涉及计算机技术领域,提供一种文本识别方法、装置、电子设备和存储介质,其中方法包括:获取待识别图像;基于文本识别模型的掩码特征提取模块,对所述待识别图像进行自适应掩码特征提取,得到掩码图;基于所述文本识别模型的底纹滤除模块,应用所述掩码图对所述待识别图像进行底纹滤除,得到底纹滤除图像;基于所述文本识别模型的文本识别模块,对所述底纹滤除图像进行文本识别。本发明提供的文本识别方法、装置、电子设备和存储介质,能够增强文本识别模型对底纹的捕捉和抗干扰能力,从而可以实现自适应对底纹格线进行掩码处理;然后基于底纹滤除图像进行文本识别,可以提高识别准确率,同时能够适应不同状态和颜色的图像。
  • 一种基于RPA和AI的图像文本识别方法及相关产品-202310015160.2
  • 孙喜民;周晶;王明达;常江;马国瑜 - 国网数字科技控股有限公司;国网电商科技有限公司
  • 2023-01-04 - 2023-04-07 - G06V30/164
  • 本申请公开了一种基于RPA和AI的图像文本识别方法及相关产品。该方法应用于流程机器人,可以包括:确定需要进行文本识别的待识别图像;对待识别图像进行预处理,得到预处理图像,并切分预处理图像中的待识别文本,得到切分文本;对切分文本进行文字识别,得到识别结果。如此,流程机器人即可自动地对于待识别图像中的文本进行文字识别,提取出其中的文本信息,极大地提高了文本转换的识别效率和准确性。同时,通过流程机器人,也可以大批量地进行上述的文字识别过程,降低人工成本,进一步提高识别效率。
  • 文本生成模型的训练方法、文本获取方法及装置-202211417275.6
  • 丁思宇;赵晏彬;王硕寰;孙宇 - 北京百度网讯科技有限公司
  • 2022-11-11 - 2023-04-04 - G06V30/164
  • 本公开提出了一种文本生成模型的训练方法、文本获取方法及装置,涉及自然语言处理和深度学习等人工智能领域,方法包括基于原始文本对初始文本生成模型进行训练,得到候选文本生成模型;对原始文本进行扰动,以获取原始文本的噪声文本;获取原始文本和噪声文本的字符映射关系;根据原始文本、噪声文本和字符映射关系,对候选文本生成模型进行训练,以得到训练好的目标文本生成模型。本公开中,提高了目标文本生成模型输出的文本内容与人们惯用的阅读习惯之间的适配度,优化了人们的阅读体验,提高了目标文本生成模型在重复文本内容生成场景下的鲁棒性,优化了文本生成模型的实用性和适用性。
  • 基于深度学习的小学生数学算式识别及自动批改方法-202210783495.4
  • 罗卓彦;薛晖 - 东南大学
  • 2022-07-05 - 2022-11-15 - G06V30/164
  • 本发明公开了一种基于深度学习的小学生数学算式识别及自动批改方法,首先对含算式图像进行预处理,滤除冗余的边框信息,其次利用基于数据增广训练的BTTR模型进行算式的识别,最后利用涵盖多种数学题目类型的批改模板对识别结果进行批改,完成多种题型的自动批改。本发明实现由数学算式输入到批改结果输出的过程,基于Transformer的序列模型能够解决识别时字符级噪音及长序列依赖的问题,结合数据增广的训练方式有效地提升模型的泛化能力,多样化的模板能够匹配不同类型的算式,最终实现一种功能强大的小学生数学作业自动识别与批改的方法。
  • 一种文本行噪声拒识方法、装置、电子设备和存储介质-202210646919.2
  • 高大帅;李健;陈明;武卫东 - 北京捷通鸿泰科技有限公司
  • 2022-06-09 - 2022-08-30 - G06V30/164
  • 本发明实施例提供了一种文本行噪声拒识方法、装置、电子设备和存储介质,包括:将待识别文本行图像区域输入文本行噪声拒识模型得到识别结果,该图像区域包括具有类文字噪声的图像区域;该拒识模型基于具有类文字噪声的样本、不具有类文字噪声的样本和文本标注训练得到,拒识模型包括卷积循环网络和置信度打分网络,采用共同学习相互监督策略进行训练;若该图像区域不具有类文字噪声,输出文本行识别结果以及置信度;若该图像区域具有类文字噪声,输出空白识别结果。本发明实施例可以通过文本行噪声拒识模型识别出具有类文字噪声的图像区域,而现有识别模型会输出噪声无序文字,从而提升在含有类文字噪声文本图像上的识别率,进一步提升用户体验。
  • 一种字符图像识别方法、装置、设备及介质-202210378882.X
  • 周涛;吴婕;邵蒙悦;庄林志;李天鹏;吴吉灵 - 济南博观智能科技有限公司
  • 2022-04-12 - 2022-07-08 - G06V30/164
  • 本申请公开了一种字符识别方法、装置、设备及介质,包括:将目标域数据集和源域数据集分别进行图像预处理,以获取与所述目标域数据集对应的目标域图像和与所述源域数据集对应的源域图像;利用自编码器模型中的编码器和解码器对所述目标域图像进行自监督重建训练,并利用所述编码器对所述源域图像进行有监督分类训练与验证;判断当前是否满足预设训练结束条件,如果否则重新跳转至所述利用自编码器模型中的编码器和解码器对所述目标域图像进行自监督重建训练的步骤,直到满足所述预设训练结束条件,以得到字符识别模型;利用所述字符识别模型确定所述目标域数据集对应的字符识别结果。通过上述方案,能够对字符图像进行精确识别。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top