[发明专利]文档段落位置提取装置在审

专利信息
申请号: 202111529231.8 申请日: 2021-12-14
公开(公告)号: CN114495142A 公开(公告)日: 2022-05-13
发明(设计)人: 宗天睿;张鹤;李沄沨;许若华;杨林;吴冠昊;蔡欣达 申请(专利权)人: 中图科信数智技术(北京)有限公司
主分类号: G06V30/414 分类号: G06V30/414;G06V30/146;G06V30/18
代理公司: 北京劲创知识产权代理事务所(普通合伙) 11589 代理人: 王闯
地址: 100000 北京市海淀区温泉*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种文档段落位置提取装置,所述装置包括:处理模块,用于对待处理文档的页面进行图像化处理,得到第一图像;清理模块,用于根据所述第一图像中包括的非空白区域,确定所述第一图像中的文字轮廓;分栏模块,用于根据所述第一图像以及所述第一图像中包括的文字轮廓,确定所述第一图像中是否包括分栏信息;分割模块,用于根据所述第一图像中是否包括分栏信息,确定所述待处理文档的页面的文档段落位置。本发明从图像处理角度出发,通过融合轮廓信息,对待处理文档进行清理、分栏并分割段落,提高了文档段落位置定位的普适性、准确性和可靠性。
搜索关键词: 文档 段落 位置 提取 装置
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中图科信数智技术(北京)有限公司,未经中图科信数智技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202111529231.8/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于图形嵌套关系的图层识别新方法-202310806871.1
  • 孙钦平;马嘉林;王锁成;潘超杰;崔方剑;张东亮;韩岩杰;孙光辉;夏波;李帅斌;王学平;张春雨 - 青岛海信信息科技股份有限公司
  • 2023-07-04 - 2023-10-27 - G06V30/414
  • 本发明提供了一种基于图形嵌套关系的图层识别新方法,属于人工智能技术领域,其方法包括:对图片进行区域化处理,获取处理后的图片;基于所述处理后的图片进行嵌套结构提取;根据提取结果识别出各个嵌套结构之间的关系;基于所述各个嵌套结构之间的关系构建图层嵌套树;基于所述图层嵌套树进行常规字体笔画提取。解决了传统的图像文字识别技术通过图像处理和统计机器学习方法从图像中提取文本信息,包括二值化、噪声滤波、相关域分析等,其依赖于充足的训练样本以及清晰地特征规则,但在很多实际问题中无法获取足够训练样本,这对传统技术提出挑战,对具有普适性的新识别技术产生需求的问题。
  • 点读方法及点读数据处理方法-201910184699.4
  • 李博韧;王全占;古鉴 - 阿里巴巴集团控股有限公司
  • 2019-03-12 - 2023-10-27 - G06V30/414
  • 本申请公开了一种点读方法,包括:获得包含待识别点读对象的源图像;获得与所述源图像匹配的图像母本;根据所述源图像和所述图像母本,获得所述待识别点读对象在所述图像母本中的定位信息;根据所述定位信息获得所述待识别点读对象对应的多媒体资源信息;输出所述多媒体资源信息。采用上述方法,解决了现有的点读技术中点读笔存在的能点读的内容受限以及推广成本高的问题,以及现有点读机存在点读内容受限、操作繁琐、推广成本高以及便携度受限的问题。
  • 表格图像识别方法、装置、设备及计算机存储介质-202210369393.8
  • 黄恺 - 腾讯科技(深圳)有限公司
  • 2022-04-08 - 2023-10-24 - G06V30/414
  • 本申请公开了一种表格图像识别方法、装置、设备及计算机存储介质,涉及图像识别技术领域,用于提升表格图像识别结果的准确性。该方法包括:通过表格元素检测模型,基于表格图像对应于L个图像尺度的元素特征图进行单元格检测,并基于所述L个图像尺度之间的相关性,对获得的多个单元格检测结果进行融合处理,获得所述表格图像中各单元格的位置信息;通过所述表格元素检测模型对所述表格图像进行表格线检测,获得所述表格图像对应的表格线前景图;基于所述各单元格的位置信息和所述表格线前景图进行表格结构还原,获得目标表格结构;基于所述目标表格结构以及所述表格图像中的文本信息进行表格文档还原,获得目标表格文档。
  • 对图纸定位设计区域的方法、装置和设备-202310965196.7
  • 郭思佳;张婧鹤;郑于锷 - 深圳市金地数字科技有限公司
  • 2023-08-01 - 2023-10-24 - G06V30/414
  • 本申请提供了一种对图纸定位设计区域的方法、装置和设备,包括对含有设计区域的图纸进行尺寸、颜色调整获得定位图像;通过训练的定位模型在定位图像中搜索区块,将所述定位图像中与设计区域特征相同的区块标记为设计区块;根据图纸与定位图像两者的尺寸比例关系,计算设计区块在所述图纸中映射的设计区域的坐标信息。本申请解决了计算机对图纸中设计区域进行定位需要浪费大量时间的技术问题。
  • 文件信息确定方法、装置、设备及可读存储介质-201910267239.8
  • 陈奕雷;聂志鹏 - 腾讯科技(深圳)有限公司
  • 2019-04-03 - 2023-10-24 - G06V30/414
  • 本申请公开了一种文件信息确定方法、装置、设备及可读存储介质,涉及图像处理领域。该方法包括:获取目标文件,目标文件中包括图形标识码;对图形标识码进行识别,得到目标文件中的待确定区域;获取待确定区域的区域信息;当区域信息所表示的内容填写情况符合内容填写条件时,确定目标文件符合填写要求。通过在目标文件中设置图形标识码,并通过图形标识码对该目标文件中的待确定区域进行标识,在对目标文件是否符合填写要求进行核对时,通过图形标识码确定待确定区域,并根据区域信息确定该目标文件是否符合填写要求,避免通过人工逐个对目标文件进行核对,文件信息确定效率高,节省文件信息确定过程中的人力资源以及时间资源。
  • 结合像素分割和线段锚的文本检测方法、系统及装置-202110083664.9
  • 李源;杨曦露 - 上海云从汇临人工智能科技有限公司
  • 2021-01-21 - 2023-10-20 - G06V30/414
  • 本发明涉及文本检测控制技术领域,具体提供结合像素分割和线段锚的文本检测方法、系统及装置,旨在解决在文本检测过程中如何避免密集文本容易粘连和回归长文本的边界不准的技术问题。为此,本发明的方法包括:通过像素分割获得文本图像的像素点;以每一所述像素点为线段中心垂直设置多根不同长度的线段锚;确定每一像素点的文本标签和所述对应每一像素点的线段锚的文本标签,并基于所述像素点和所述线段锚训练文本检测模型;应用所述文本检测模型对文本进行检测,获得检测后的文本行。本发明在文本检测中既能避免文本粘连问题,又能准确回归长文本的边界,具有很强的泛化能力和抗干扰能力,保证文本检测在整个光学字符识别的正确性与准确性。
  • 题目切分数据获取方法、装置、电子设备及存储介质-202310709985.4
  • 韦秋华;周航;王亚萌 - 汉王科技股份有限公司
  • 2023-06-15 - 2023-10-10 - G06V30/414
  • 本申请公开了一种题目切分数据获取方法、装置,属于图像处理技术领域。本方法包括:获取未作答的目标题目页的第一图像对应的第一题目切分数据,第一题目切分数据包括:第一题号及其对应的第一题号区域;获取已作答的目标题目页的第二图像;对第二图像进行题目元素检测,得到第二图像对应的题目元素信息,题目元素信息包括:第二题号区域,以及第二题号区域中的第二题号;根据第一题号、第一题号区域、第二题号以及第二题号区域,计算第一图像和第二图像之间的图像变换关系;根据图像变换关系对第一题目切分数据和题目元素信息进行匹配校验,得到第二题目切分数据用于对第二图像进行题目切分。本方法提升了对已作答试卷等的图像的题目切分准确度。
  • 一种手绘表格识别的方法、系统及介质-202110757815.4
  • 王瑜;王龙晖;胡焱;牛鹏 - 浪潮金融信息技术有限公司
  • 2021-07-05 - 2023-10-10 - G06V30/414
  • 本发明公开了一种手绘表格识别的方法、系统及介质,所述方法包括以下步骤:绘制矩形,得到图形轮廓;通过多边形拟合算法,对图形轮廓执行转换操作,得到标准矩形;绘制直线,对标准矩形执行第一分割操作,得到表格;通过标准矩形和表格执行建模操作,得到二叉树;绘制直线或者斜线,对表格执行第二分割操作,对二叉树执行遍历更新操作,得到更新二叉树;对表格执行移动操作或者执行缩放操作,得到更新表格;通过动态规划方法,根据更新表格,对更新二叉树执行更新操作,得到表格二叉树;通过上述方式,本发明可以实现精确识别手绘图形,将手绘不规则矩形转换为标准矩形,在表格发生移动或缩放后,完整的显示移动或缩放后的表格,提升用户体验。
  • 一种文本位置关系的匹配方法、装置、设备及存储介质-202310742292.5
  • 凌峻;王舒远 - 中国银行股份有限公司
  • 2023-06-21 - 2023-10-03 - G06V30/414
  • 本申请实施例公开了一种文本位置关系的匹配方法、装置、设备及存储介质,可用于金融领域或其他领域。在该方法中,根据预设的识别模型对目标文本图像进行识别,得到文本信息;根据文本位置计算各个文本框之间的重叠率,通过计算各文本框之间的重叠率的方式感知各个文本框之间的相互位置关系信息;若第一文本框和第二文本框之间的位置关系信息符合预设条件,则将第一文本框和第二文本框进行合并调整,得到调整后的文本信息;将调整后的文本信息输入预设的二维数组进行匹配,得到匹配结果,通过将符合条件的文本框合并,从而获得识别模型识别输出的文本位置关系,提升文本图像的识别效果。
  • 表格结构提取方法、装置、电子设备及存储介质-202111567741.4
  • 胡先军;王乐义;向宇波;秦铎浩;刘明浩 - 北京百度网讯科技有限公司
  • 2021-12-20 - 2023-10-03 - G06V30/414
  • 本公开提供了一种表格结构提取方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及图像处理、自然语言理解技术领域,包括:获取第一表格图像;对第一表格图像进行文字识别,得到多个文字和各文字对应的坐标;判断第一表格图像中的表格是否为全线结构;若否,则对第一表格图像进行图像分割,得到第一表格结构;对第一表格结构进行欠分割处理,得到第二表格结构;对第二表格结构进行过分割处理,得到第三表格结构;根据多个文字和各文字对应的坐标对第三表格结构进行填充,得到目标表格。
  • 一种器官功能报告的解析方法、装置以及电子设备-202310501001.3
  • 刘发鹏;王巨鹏;彭海涛;宋聪聪;禇志明;王小月 - 北京啄木鸟云健康科技有限公司
  • 2023-05-05 - 2023-09-29 - G06V30/414
  • 本申请实施例提供一种器官功能报告的解析方法、装置以及电子设备。其中,器官功能报告的解析方法包括:获取携带品牌标识的待解析器官功能报告文本;其中,待解析器官功能报告文本为PDF格式的文本;根据品牌标识,确定待解析器官功能报告文本中多个信息区域的分区特征;根据多个信息区域的分区特征,分别将多个信息区域转化为图像,得到多个信息区域图像;采用预设识别算法,分别对多个信息区域图像中的内容进行识别,得到待解析器官功能报告文本中每一个信息区域的结构化的数据信息;对待解析器官功能报告文本中所有信息区域的结构化的数据信息进行组合,得到待解析器官功能报告文本的目标结构数据。
  • 图片信息提取方法、装置、计算机设备及存储介质-202011288930.3
  • 刘东煜;陈乐清;张涛;曾增烽 - 中国平安人寿保险股份有限公司
  • 2020-11-17 - 2023-09-29 - G06V30/414
  • 本申请实施例属于人工智能技术领域,涉及一种图片信息提取方法及相关设备,可应用于智慧政务领域,包括:获取目标图片,检测目标图片中每个元素的信息边界框;根据信息边界框对元素进行粗排序,得到粗排序元素表,基于粗排序元素表获取目标图片的高置信度行;计算高置信度行中每个元素的中心坐标,根据中心坐标计算高置信度行的斜率;获取目标图片中所有元素的中心坐标,根据中心坐标和斜率确定元素属于同一行的行片段,以及元素属于同一列的列片段;按照行片段和列片段对所有元素重新进行排序,得到目标图片对应的结构化信息表。此外,本申请还涉及区块链技术,结构化信息表可存储于区块链中。本申请实现了对图片信息的准确提取。
  • 文本识别方法、装置及设备-201910197234.2
  • 程战战 - 杭州海康威视数字技术股份有限公司
  • 2019-03-15 - 2023-09-26 - G06V30/414
  • 本说明书提供一种文本识别方法、装置及设备,该方案预先训练有切割模型,由切割模型获得待识别文本图像的切割位置,从而可以将待识别文本图像切割出大小合适的子图像,防止图像中的文本被不完整切割;由于将图像切割了多个子图像,为了防止上下文信息丢失,已训练的文本识别模型可以识别输入的子图像的语义特征信息,并结合语义特征信息上下文识别出各子图像对应的文本信息,进而可识别所述待识别文本图像。
  • 一种文本获取方法及其相关设备-202310488188.8
  • 柏昊立;毛志铭;侯璐;魏建生;刘群;蒋欣 - 华为技术有限公司
  • 2023-04-28 - 2023-09-15 - G06V30/414
  • 本申请公开了一种文本获取方法及其相关设备,可从目标图像中获取准确的目标文本。本申请的方法包括:当需要从目标图像中提取目标文本时,可先获取包含多个文本的目标图像,并将目标图像输入至目标模型。接着,目标模型可对目标图像进行编码,从而得到目标图像的特征。然后,目标模型可对目标图像的特征进行处理,从而得到多个文本中的目标文本在目标图像中的位置信息。最后,目标模型可对目标图像的特征以及目标文本在目标图像中的位置信息做进一步的处理,从而得到目标文本。至此,则成功从目标图像中提取出了目标文本。
  • 一种图像切边方法及装置、存储介质及电子设备-202310830399.5
  • 石剑锋 - 武汉网幂科技有限公司
  • 2023-07-07 - 2023-09-15 - G06V30/414
  • 本申请提供了一种图像切边方法及装置、存储介质及电子设备,该方法应用于移动设备,通过先对文档图像进行图像预处理,接着利用预先建立的边缘检测模型,对图像预处理后的文档图像中的所述文档区域进行边缘检测,得到所述文档区域的边缘信息,然后依据述边缘信息,对图像预处理后的文档图像中的文档区域进切边处理,得到目标图像,最后在移动设备上显示目标图像。实现了高效、准确地对文档区域进行自动切边,从而提高文档图像的可读性和美观度。并且,本申请方案具有计算复杂度低、内存占用少等优点,能够适用于手机等移动设备上的实时文档切边场景。
  • 段落检测方法和装置、电子设备和存储介质-202310807548.6
  • 秦海波;沈磊;林辉;段亦涛 - 网易有道信息技术(北京)有限公司
  • 2023-07-03 - 2023-09-15 - G06V30/414
  • 本发明的实施方式提供了一种段落检测方法和装置、电子设备和存储介质,包括:获取目标文本图片中的文本行实例,其中,目标文本图片为包括文本、且需要进行段落检测的图片,文本行实例是属于同一行的文本或者属于同一列的文本;按照与每个文本行实例对应的实例特征,对所有文本行实例进行聚类,确定出目标文本图片中的至少一个目标段落,其中,实例特征用于指示所对应文本的视觉表示和/或位置,目标段落中包括至少一个文本行实例。通过本申请能够克服相关技术中存在的容易出现段落漏检以及会带来额外计算量的技术问题。
  • 文本行的识别方法、装置、存储介质和电子设备-202310640084.4
  • 杨明坤;马志国;张飞飞 - 新东方教育科技集团有限公司
  • 2023-05-31 - 2023-09-12 - G06V30/414
  • 本公开涉及一种文本行的识别方法、装置、存储介质和电子设备,涉及图像识别技术领域,该方法包括:获取待识别的文本行图像;将所述文本行图像转换为二值图像;获取所述二值图像中的二值图矩形框,以及所述文本行图像中与所述二值图矩形框对应的待定文本行框;基于所述二值图矩形框,去除所述待定文本行框中的冗余信息,得到目标文本行框;所述目标文本行框中仅包含一行文本;根据所述目标文本行框,确定所述文本行图像中的印刷体文本对应的文本行信息。这样,可以确保每个目标文本行框中仅包含一行文本,从而在根据目标文本行框进行文本识别的时候,能够准确的识别出对应的印刷体文本的文本行信息。
  • 一种文本处理方法和装置-201910208026.8
  • 余红 - 创新先进技术有限公司
  • 2019-03-19 - 2023-09-12 - G06V30/414
  • 本申请公开了一种文本处理方法和装置,该方法包括:获取包含多行文本的图片;对所述图片进行文本识别,得到多行待处理文本以及所述多行待处理文本的段落特征信息,所述多行待处理文本之间相互独立;基于所述段落特征信息对所述多行待处理文本进行合并,得到包含至少一个段落的目标文本。
  • 一种具有加密功能的智能图文识别方法及系统-202310815676.5
  • 严松;黄奎;刘利科 - 四川集鲜数智供应链科技有限公司
  • 2023-07-05 - 2023-09-08 - G06V30/414
  • 本发明公开了一种具有加密功能的智能图文识别方法及系统,属于数据处理技术领域,本发明先对图像灰度处理,便于提取轮廓图,在轮廓图提取后,对灰度值进行归一化处理,降低计算量,再对归一化轮廓图进行分类处理,得到图像上各个轮廓对象的类型,在存在文字类型时,从归一化轮廓图上提取出文字部分的文字轮廓图,避免其他非文字部分对文字识别过程的影响,提高文字识别精度,采用文字识别模型对文字轮廓图进行识别,得到文字信息,将文字信息和类型信息加密输出,避免识别方随意获取图文信息。
  • 一种医疗票据图像文字移除方法及系统-202310662071.7
  • 黄叶珏;褚一平;钱丽丹;赵瑞芬;孙曜文 - 浙江经贸职业技术学院
  • 2023-06-06 - 2023-09-05 - G06V30/414
  • 本发明属于OCR文字识别领域,具体涉及一种医疗票据图像文字移除方法,首先提出了一种字符分割的训练数据生成方法,通过分析医疗票据图像中的文字版面信息,生成字符分割网络所需的训练数据。其次,构造由小波字符图像规范化子模块和字符分割网络组成的字符分割模块,以提高字符分割的准确性和稳定性。最后,针对医疗票据图像特点设计了一种字符填充方法,实现了医疗票据图像的文字移除。本发明实现了医疗票据图像的文字移除。通过这些无文字的医疗票据图像就可以方便地合成接近真实业务场景的训练数据,以提高医疗票据OCR模型的准确率。
  • 一种基于多类型平面图获取板形外轮廓的方法及建模方法-202310460661.1
  • 姚永明;张友三 - 长沙泛一参数信息技术有限公司
  • 2023-04-25 - 2023-09-05 - G06V30/414
  • 本发明公开了一种基于多类型平面图获取板形外轮廓的方法,包括:分别提取墙、梁、柱的外形轮廓图;依据全局的轴网坐标系,将墙、梁、柱的外形轮廓图全部转换到同一结构板图上,组合得到组合平面图;将结构板图抬高转为立体结构,将组合平面图抬高转为组合立体结构,对立体结构切除组合立体结构,得到板的初立体结构;根据板的初立体结构获取横截面,得到板的初轮廓;在板的初轮廓中寻找封闭曲线,得到板的外轮廓。也公开了一种建模方法,在获取上述外轮廓后,根据各自的参数特征提取板的参数;根据板的外轮廓和板的参数,进行板的建模。本发明解决墙、梁、柱的尺寸发生调整导致的提取的板形的外轮廓不准确,影响板的建模的问题。
  • 一种跨页段落识别拼接方法及装置-202310640143.8
  • 蔡君;唐亮;何绮珊;郑彦丹 - 广东南方网络信息科技有限公司
  • 2023-05-31 - 2023-08-29 - G06V30/414
  • 本发明公开了一种跨页段落识别拼接方法及装置,包括:获取待识别文件,识别待识别文件的版面属性信息;所述待识别文件包括当前页文件和下一页文件;根据所述版面属性信息定位所述待识别文件的待拼接语句所在位置,并提取所述待拼接语句;根据语义依存特性确认所述待拼接语句是否为一句完整语句;并根据确认结果判断所述待识别文件是否存在跨页段落,当所述待识别文件存在跨页段落时拼接所述待识别文件中的跨页段落。通过定位当前页文件和下一页文件中的待拼接句子,从而根据语义依存特性分析待拼接句子是否为一句完整语句来确认当前页文件和下一页文件中是否存在跨页段落。
  • 一种银行卡号识别方法、装置、设备及介质-202310689351.7
  • 徐静雯 - 中国银行股份有限公司
  • 2023-06-12 - 2023-08-29 - G06V30/414
  • 本申请公开了一种银行卡号识别方法、装置、设备及介质,涉及人工智能领域或金融领域。该方法包括:获取原始图像;定位原始图像中的卡号区域;切割卡号区域,以得到卡号的单个字符;通过卷积神经网络模型识别卡号的单个字符,以获取银行卡号。由此,通过以数学形态学为原理,定位原始图像中卡号行所在位置,并对卡号进行字符级切割,最后使用卷积神经网络模型对切割后的单个卡号字符进行识别。由于是对单个卡号字符进行识别,因此可以提高银行卡号识别的准确率和效率。
  • 一种文本检测模型的确定方法、装置及电子设备-202310644201.4
  • 陈永洒;王敏 - 联想(北京)有限公司
  • 2023-06-01 - 2023-08-29 - G06V30/414
  • 本申请公开了一种文本检测模型的确定方法、装置及电子设备,该方法包括:获得初始文本检测模型针对待检测文本的第一检测结果,以及与待检测文本对应的第二检测结果;第二检测结果表征与待检测文本的真实标注结果;确定初始文本检测模型被应用时的应用特征;基于应用特征,分别确定与第一检测结果对应的第一应用结果,以及与第二检测结果对应的第二应用结果;基于第一应用结果和第二应用结果,确定与初始文本检测模型对应的目标文本检测模型。
  • 一种基于OCR的营养元素自动识别方法-202310561871.X
  • 常益凡;杨晓宇;李志强;林若希;南京 - 新疆中科跃维科技有限公司
  • 2023-05-18 - 2023-08-25 - G06V30/414
  • 本申请涉及健康管理技术领域,公开了一种基于OCR的营养元素自动识别方法,所述方法包括以下步骤:S1.对图像进行矫正以及表格结构识别,然后对图像进行切分,最终得到仅包含营养成分表的表格图像;S2.构建并训练改进的DBNet文本检测网络,对仅包含营养成分表的图像进行文本检测,得到文本的定位坐标;S3.构建并训练CRNN文本识别网络,根据步骤S2中定位后得到的坐标进行文本识别,得到文本识别内容;S4.根据文本识别的结果识别该食品的营养成分和含量。本申请能够对食品包装上的表格进行定位,并对食品具体的营养成分与含量进行识别,用户可以通过对食品包装进行拍摄,进而获得具体的营养成分与每100g的含量,帮助用于更好地进行健康管理,合理膳食。
  • 一种数据处理方法及装置-201911359781.2
  • 乔健;罗嘉文;王靓伟;郑荣福 - 华为技术服务有限公司
  • 2019-12-25 - 2023-08-25 - G06V30/414
  • 本发明实施例公开一种数据处理方法及装置,该方法包括:获取包括多张图像的待处理数据,多张图像包括文字;确定多张图像包括的图像块的类型和位置,图像块的类型包括文字;根据图像块的类型和图像块的位置,提取图像块中的数据以及数据之间的逻辑关系,该数据包括文字以及文字的文字特征;根据逻辑关系对数据进行结构化处理,得到结构化数据。该方法可以自动提取图像中的数据,并对提取的数据进行结构化处理,可以提高数据处理效率。
  • 一种文字识别方法、装置及计算机可读存储介质-201911177163.6
  • 马文伟;刘设伟;沈程秀;闫永泽 - 泰康保险集团股份有限公司;泰康在线财产保险股份有限公司
  • 2019-11-26 - 2023-08-25 - G06V30/414
  • 本发明提供了一种文字识别方法、装置及计算机可读存储介质,所述方法包括:对待识别的椭圆形印章图像进行二值化处理,得到二值图像;检测二值图像中位于同一条直线上的第一文字序列;根据二值图像中的文字的连线所组成的第一椭圆与第一文字序列的位置关系,从第一文字序列中确定呈直线型分布的文字序列;分别对呈直线型分布的文字序列、呈弯曲型分布的文字序列中的文字进行识别,呈弯曲型分布的文字序列包括呈直线型分布的文字序列之外的文字。在上述方法中,首先检测出直线型文字序列,剩下的文字组成弯曲型文字序列,由此可轻松确定出弯曲型文字序列;并且,本方案中对文字可以有效地按照语义顺序进行提取,降低了文字识别难度。
  • 一种基于关键点提取票据图像表格区域的方法及系统-202310607075.5
  • 孙召敏;马杰 - 南京市智慧医疗投资运营服务有限公司
  • 2023-05-26 - 2023-08-22 - G06V30/414
  • 本发明公开了一种基于关键点提取票据图像表格区域的方法,涉及图像识别技术领域,包括如下步骤:首先通过HTTP协议,获取前端的票据图片并对图像进行预处理;然后对图像进行水平矫正;标注数据训练神经网络模型,检测水平正向的图像中票据是否有褶皱,针对没有褶皱的票据数据,标注数据训练神经网络模型,检测票据的4个角点,利用4个角点,对图片中票据区域进行透视变换,得到矫正后的规则矩形状的票据表格区域,并提取票据表格区域。本发明可针对票据上关键点进行识别提取,并可对票据图像表格区域进行矫正处理,使提取的票据图像表格区域更加的规整,可提高票据后续内容识别的准确性。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top