[发明专利]一种文本图像中表格的结构化信息的识别方法及装置有效

专利信息
申请号: 202010079924.0 申请日: 2020-02-04
公开(公告)号: CN111259854B 公开(公告)日: 2023-04-18
发明(设计)人: 刘宁;吴志超;王静;胡茜;董婉;申亚男 申请(专利权)人: 北京爱医生智慧医疗科技有限公司
主分类号: G06V30/413 分类号: G06V30/413;G06V30/146;G06V30/148;G06F40/174;G06F40/177
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 王宇杨
地址: 102206 北京市昌平*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明实施例提供一种文本图像中表格的结构化信息的识别方法及装置,所述方法包括:在所述文本图像中确定属于同一个表格内的表格线,确定与所述表格线的方向相垂直的第一目标坐标轴;确定所述同一个表格内的初始单元格;确定相邻两个初始单元格的交线,构建包含所述交线的多边形,确定所述多边形的包围区域内的线段像素数,并根据所述线段像素数和预设阈值的比较结果,确定是否合并相邻两个初始单元格;遍历所有相邻两个初始单元格,并根据合并结果确定结构化信息的识别结果。所述装置执行上述方法。本发明实施例提供的方法及装置,能够自动和准确地识别文本图像中表格的结构化信息。
搜索关键词: 一种 文本 图像 表格 结构 信息 识别 方法 装置
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱医生智慧医疗科技有限公司,未经北京爱医生智慧医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202010079924.0/,转载请声明来源钻瓜专利网。

同类专利
  • 表格还原方法和装置、存储介质及电子设备-202310003307.6
  • 陈乐清;张松国;王钰博 - 腾讯科技(深圳)有限公司
  • 2023-01-03 - 2023-10-27 - G06V30/413
  • 本公开提供了一种表格还原方法和装置、存储介质及电子设备。其中,该方法包括:获取目标图片的字符识别结果,其中,字符识别结果用于指示目标图片中包括的字符集合以及字符集合中每一个字符对象的位置信息;基于字符识别结果,从字符集合中确定出字符对象之间的目标表格位置关系;利用目标表格位置关系确定出多个候选单元格字符子集,其中,候选单元格字符子集中包含的字符对象位于同一候选单元格;根据多个候选单元格字符子集还原与目标图片对应的目标表格。本公开解决了相关技术对表格进行还原的还原效果差的技术问题。
  • 一种基于图像识别的档案分类与归档系统-202310832263.8
  • 杨吉伟;蒋卫星;黎浩江 - 东莞市铁石文档科技有限公司
  • 2023-07-07 - 2023-10-27 - G06V30/413
  • 本发明公开了一种基于图像识别的档案分类与归档系统,涉及档案管理领域,包括档案管理中心,所述档案管理中心通信连接有档案管理模块,所述档案管理模块通信连接有智能采集模块、智能鉴定模块、智能筛选模块以及档案储存模块;所述档案管理模块用于档案管理员对档案资料进行相关的处理;所述智能采集模块用于采集档案资料;所述智能鉴定模块用于鉴别所采集档案资料的真伪,将真实的档案资料发送至智能筛选模块;所述智能筛选模块用于筛选档案资料是否合格;所述档案储存模块用于对档案资料进行分类,根据分类结果对其进行储存;本发明的有益效果为避免对档案资料处理的过程中存在虚假的档案资料。
  • 基于多模态混合模型的业务数据处理方法及装置-202111007560.6
  • 谯轶轩;陈浩 - 平安科技(深圳)有限公司
  • 2021-08-30 - 2023-10-27 - G06V30/413
  • 本申请提供一种基于多模态混合模型的业务数据处理方法及装置,涉及人工智能技术领域,主要目的在于改善现有利用针对单一模态数据的单独模型进行多模态的数据处理导致的各个模态之间的处理无关联性,从而降低了保单数据处理的整体性准确率和业务数据处理效率的问题。包括:解析保单业务信息中的图像数据、以及文本数据;基于完成训练的多模态混合模型对所述图像数据、所述文本数据进行多模态混合识别处理,得到多模态混合处理结果;根据所述多模态混合处理结果对所述保单业务信息进行标签分类,并解析标签分类后各标签分类的保单业务需求以及承保启动触发事件;当检测到所述承保启动触发事件,则启动对所述保单业务信息的承保操作。
  • 票据信息获取方法、装置、计算机设备和存储介质-202010012175.X
  • 万爽;夏晓玲;陆昱 - 深圳追一科技有限公司
  • 2020-01-07 - 2023-10-27 - G06V30/413
  • 本申请涉及一种票据信息获取方法、装置、计算机设备和存储介质。所述方法包括:获取票据图像,并检测所述票据图像中的文本框和所述文本框中的文本内容;获取票据模板的属性框中的文本内容,将所述属性框中的文本内容和所述文本框中的文本内容进行匹配,得到与所述属性框相匹配的文本框;所述票据模板中包括属性框和信息框;根据相匹配的属性框和文本框,确定所述票据模板和所述票据图像之间的映射关系;根据所述映射关系将所述票据模板的属性框和信息框映射到所述票据图像上,并将映射到所述票据图像上的属性框和信息框中的信息作为所述票据图像的目标信息。采用本方法能够提高票据图像中的关键信息获取的准确性。
  • 一种表格处理方法、装置、存储介质及设备-202210366619.9
  • 黄恺 - 腾讯科技(深圳)有限公司
  • 2022-04-08 - 2023-10-24 - G06V30/413
  • 本申请实施例公开了一种表格处理方法、装置、存储介质及设备。方法包括:获取包括目标表格的目标图像;响应于针对目标图像中的目标表格的还原操作,输出还原表格;还原表格具有合法性的目标表格结构,目标表格结构是根据初始表格结构的结构属性信息对初始表格结构进行合法性调整得到的;初始表格结构的结构属性信息和初始表格结构是对目标图像中的目标表格进行识别得到的。通过本申请可以提高表格还原的准确性。
  • 一种信息提取方法、装置、设备及可读存储介质-202310582875.6
  • 邱星煜;易宗权;吴杰;齐伟钢 - 中电科网络安全科技股份有限公司
  • 2023-05-23 - 2023-10-24 - G06V30/413
  • 本申请涉及信息处理技术领域,并公开了一种信息提取方法、装置、设备及可读存储介质,该方法包括:获取目标文档,并切分目标文档,得到平文本和表格文本;对表格文本进行表述转换,得到表格平文本;对平文本和表格平文本进行文本提取,得到目标文档对应的纯文本;对纯文本进行信息抽取,得到目标信息。在本申请中,首先对目标文档进行切分,从而得到平文本和表格文本。然后对平文本和表格文本进行归一化,进而得到目标文档对应的纯文本;对纯文本进行信息抽取,即可得到目标信息。也就是说,无论目标文档是何格式,本申请均可从目标文档中提取到目标信息,即本申请能够支持从多类型文档中检测出特定信息。
  • 一种基于OCR技术的实物盘点表单智能统计方法及系统-202210339789.8
  • 郭远志;李海波 - 郭远志
  • 2022-04-01 - 2023-10-24 - G06V30/413
  • 本发明涉及一种基于OCR技术的实物盘点表单智能统计方法,包括以下步骤:对多份盘点表进行拍摄扫描;对拍摄得到的盘点表图片文字及数据信息进行文字识别;对盘点表数据运算处理并进行分类处理,生成一份EXCEL表格;通过数据传输模块,将生成EXCEL表传输至数据库中,供职能部门使用。本发明提供了一种便捷式、小型化、手持型快捷的,能一次完成多张拍数据表单并立即转化成数据后汇总成一个电子表格的基于OCR技术的实物盘点表单智能统计方法及系统。
  • 文本区域识别方法、装置、终端设备及可读存储介质-201911159636.X
  • 施烈航;姚恒志;王志远;冯霞 - 华为技术有限公司
  • 2019-11-22 - 2023-10-24 - G06V30/413
  • 本申请适用于终端人工智能领域以及对应的计算机视觉技术领域,提供了一种文本区域识别方法、装置、终端设备及可读存储介质,所述方法包括:获取待检测图像,所述待检测图像包括至少一个文本行;将所述待检测图像输入到训练后的文本识别模型中处理,得到由所述至少一个文本行的文本行首和文本行尾所构成的文本区域。由于文本识别模型是通过首尾特征点回归分支训练得到的,对文本识别模型的文本行首和文本行尾的权重进行了调整,使得文本识别模型能够准确识别得到各个文本行的行首和行尾,避免了由于文本行首和文本行尾识别不准确导致文本区域识别不准确的问题,提高了识别文本行首和文本行尾的准确度,提高了识别文本区域的准确度。
  • 医疗清单纠错方法、装置、设备及计算机可读存储介质-202310779714.6
  • 徐衔 - 平安科技(深圳)有限公司
  • 2023-06-28 - 2023-10-20 - G06V30/413
  • 本发明涉及医疗科技数据处理领域,揭露一种医疗清单纠错方法,包括:对待纠错医疗清单执行行列分割得到第一医疗清单,构建第一医疗清单的表单结构特征及每个单元格的单元格结构特征,计算单元格结构特征与表单结构特征之间的结构特征差值,根据结构特征差值识别待纠错单元格,对待纠错单元格进行结构纠错,得到第二医疗清单,构建第二医疗清单中每个单元格的上下文语境,根据上下文语境生成对应单元格的预测文本,计算每个单元格的预测文本与真实文本之间的文本差值,根据文本差值识别待纠错单元格,对待纠错单元格进行文本纠错。本发明还提出一种医疗清单纠错装置、电子设备及计算机可读存储介质。本发明可以提升医疗清单纠错的准确率。
  • 结合自动标注和召回补全的教材结构提取方法和装置-202311175495.7
  • 何贵甲;黄程韦;盖君芳;黄宝忠;刘俊聪 - 之江实验室
  • 2023-09-13 - 2023-10-20 - G06V30/413
  • 本发明公开了一种结合自动标注和召回补全的教材结构提取方法和装置,将教材PDF转换为图片,并通过高精度OCR识别出图片中的每个区域的文本信息和位置信息,再结合规则模型和聚类来构建样本,并利用样本训练与区域类型对应的多种分类模型来预测区域类型未知的区域类型,最后自动召回补全缺失的部分并建立整本教材的内容及结构关系,这样能够顾实现快速准确地从教材中快速准备地提取出标题和正文,并建立相应的结构关系。
  • 表格图像识别方法、装置、设备及介质-202211528361.4
  • 郑婕;张晓川;张湛梅 - 中国移动通信集团广东有限公司;中国移动通信集团有限公司
  • 2022-11-30 - 2023-10-20 - G06V30/413
  • 本发明提供一表格图像识别方法、装置、设备及介质,包括:对待识别表格图像进行表格线像素标记,得到语义分割二值化图;对语义分割二值化图依次进行图像校正、表格线提取以及表格线位置确定,确定表格线的位置坐标;基于表格线的位置坐标,确定单元格的起止行列;对待识别表格图像进行单字符位置切分,确定字符位置信息,字符位置信息表征每一个字符的位置信息;基于起止行列和字符位置信息,对单元格与相对应的文本内容进行聚合,生成表格文件。本发明用以解决现有技术中表格检测定位不够准确的缺陷,实现提升表格检测和定位的准确度。
  • 文本识别的方法、装置、电子设备和存储介质-201911118898.1
  • 丁笑天 - 泰康保险集团股份有限公司
  • 2019-11-15 - 2023-10-20 - G06V30/413
  • 本发明公开了文本识别的方法、装置、电子设备和存储介质,涉及计算机技术领域。该方法的一具体实施方式包括:识别目标图像中的多个文本块的文本块信息;根据待输出文本集合中每个待输出文本的至少一个文本特征,以及文本块信息,筛选与每个待输出文本对应的文本块集合;对每个待输出文本,根据待输出文本的文本特征的置信分值,确定待输出文本对应文本块集合中每个文本块的置信得分,并将置信得分最高的目标文本块的内容,确定为每个待输出文本。该实施方式能够避免图像中文字识别方式中依赖于关键字词,如果识别出关键字词出现错误,则会极大影响识别结果的准确性,降低识别的准确率的问题。
  • 一种核心字段识别方法及系统-202310794104.3
  • 朱真龙;周亚杰;鹿玮;赵军;左金龙;刘银双;朱鑫;陈玉康;陈丹;向左潮 - 南京钢铁股份有限公司
  • 2023-06-29 - 2023-10-17 - G06V30/413
  • 本申请实施例提供一种核心字段识别方法及系统,该方法可以利用预先训练的识别模型对待识别表格中各个待识别字段进行识别,在识别结果指示待识别字段为核心字段,且待识别字段对应的核心字段的字段名为多个的情况下,基于待识别表格的信息从多个核心字段的字段名中确定与待识别字段匹配度最高的目标核心字段的字段名。整个方法不仅能够对待识别字段进行快速识别,效率较高,而且由于核心字段已预先进行字段名标注,因此可对各个待识别字段进行规范统一的命名,从而提高数据使用效率,为跨部门数据联动分析垫定了基础。
  • 一种文本识别方法、装置、电子设备和存储介质-202010278046.5
  • 王洪振;黄珊 - 腾讯科技(深圳)有限公司
  • 2020-04-10 - 2023-10-17 - G06V30/413
  • 本申请涉及计算机视觉技术领域,提供一种文本识别方法、装置、电子设备和存储介质,用以实现图像中不同语种的文本识别,提高识别准确率,其中,方法包括:对待识别图像进行特征提取,获取待识别图像对应的特征图,其中待识别图像包含至少一类语种类别的文本;根据特征图,对待识别图像中的文本进行位置检测,获取待识别图像中文本的位置信息,以及对待识别图像中的文本进行语种识别,获取待识别图像中文本的语种信息;基于获取到的位置信息以及语种信息,对待识别图像中的文本进行识别。由于本申请对待识别图像中各个文本进行语种预测,无需用户指定,而是灵活地根据识别出的各个语种对应的识别方法,对各个文本进行识别,识别准确率更高。
  • 业务申请单分类方法、模型、计算机设备和存储介质-202310609719.4
  • 赵志超 - 中国银行股份有限公司
  • 2023-05-26 - 2023-10-13 - G06V30/413
  • 本申请涉及一种业务申请单分类方法、模型、计算机设备、存储介质和计算机程序产品。所述方法包括:获取对目标业务申请单拍摄获得的预设图像尺寸的目标业务申请单图像;将目标业务申请单图像进行预设层级数的卷积组合特征提取,获得特征尺寸的卷积层特征;将目标业务申请单图像进行预设层级数的核函数变换组合特征提取,获得特征尺寸的核函数变换特征;融合卷积层特征和核函数变换特征,获得目标业务申请单图像的特征尺寸的综合特征;基于综合特征对目标业务申请单图像分类,获得目标业务申请单所属的业务申请单类别。本方法可用于人工智能领域,采用本方法能够提高业务申请单分类效率。
  • 表格识别方法及装置-202011139730.1
  • 金忠良;吴迪;商雷 - 长城计算机软件与系统有限公司
  • 2020-10-22 - 2023-10-13 - G06V30/413
  • 本发明公开了一种表格识别方法及装置,涉及表格识别技术领域。该方法包括:获取包含待识别表格的图片,对图片中的表格的轮廓进行检测,根据检测结果得到表格中每个单元格的相对坐标;通过卷积递归神经网络对每个单元格内的文字进行识别,如果识别失败,则通过渐进尺度扩展网络对识别失败的单元格内的文字进行识别;识别完成后,根据识别结果确定每个单元格的内容,根据每个单元格的相对坐标确定每个单元格的相对位置,生成表格文件。本发明不需要对样本数据进行字符分割,可识别任意长度的文本序列,模型速度快、性能好,并可以成功地识别相邻文本实例,从而提高识别的准确度和精确度。
  • 扭曲文档的识别方法以及装置、存储介质、计算机设备-202310819912.0
  • 徐衔 - 平安科技(深圳)有限公司
  • 2023-07-05 - 2023-10-10 - G06V30/413
  • 本申请公开了一种扭曲文档的识别方法以及装置、存储介质、计算机设备,涉及人工智能技术领域以及医疗领域,主要目的在于改善现有由于计算以及变换过程所产生的图像分辨率丢失的情况,导致校正后的图像内容清晰度差,进而导致文字识别困难,降低病历信息识别的准确率的技术问题。包括:获取目标文档的图像;基于已完成模型训练的图像校正模型对所述图像进行校正处理,生成校正后的图像,所述图像校正模型是预先基于对抗神经网络架构训练得到的;基于预设图像识别方法对所述校正后的图像进行文字识别处理,以获取所述目标文档所记载的信息。主要用于对扭曲文档进行校正。
  • 图像识别方法和装置、图像语义查询方法和装置-202310728247.4
  • 蔡毅龙;马库斯·汉斯;庞卡·库玛 - 智慧芽信息科技(苏州)有限公司
  • 2023-06-19 - 2023-10-10 - G06V30/413
  • 本申请涉及图像处理技术领域,具体涉及一种图像识别方法和装置、图像语义查询方法和装置,以及计算机可读存储介质和电子设备。图像识别方法,先对待识别图表图像进行分类处理,确定待识别图表图像中包含的图表的数量,在待识别图表图像中包含的图表的数量大于预设阈值的情况下,对待识别图表图像进行分割,得到待识别图表图像对应的多幅包含一个图表的第一图像,然后对多幅第一图像分别进行图像识别,得到待识别图表图像对应的语义信息,从而可以针对每个图表进行单独地识别,提高了图像识别的准确性,进而为后续用户在数据库中进行检索提供了准确的语义信息,有利于用户从数据库中准确地检索到目标图片。
  • 意图识别方法、装置、电子设备、存储介质-202310988734.4
  • 王杰 - 百度在线网络技术(北京)有限公司
  • 2023-08-07 - 2023-10-10 - G06V30/413
  • 本公开涉及计算机技术领域,尤其涉及计算机技术领域,尤其涉及自然语言处理、深度学习等人工智能技术领域。具体公开一种意图识别方法、装置、电子设备、存储介质。具体实现方案为:基于预设意图判定规则对待识别提示文本进行意图识别,得到第一意图识别结果;基于预先训练得到的深度学习模型对待识别提示文本进行意图识别,得到第二意图识别结果;通过查询大语言模型进行意图标注得到的历史意图识别结果,对待识别提示文本进行意图识别,得到第三意图识别结果;对多路意图识别结果进行融合得到最终的意图识别结果。通过多路意图识别,进行意图识别结果的融合,同时提升了系统基于用户提示词理解意图分类的性能和意图识别召回的覆盖率。
  • 医疗发票的漂移文本对接方法、装置、设备及存储介质-202310780959.0
  • 孙瑜尧 - 平安科技(深圳)有限公司
  • 2023-06-28 - 2023-10-03 - G06V30/413
  • 本发明涉及数据处理及数字医疗技术,揭露了在对医疗发票进行数据审核管理入库等场景下的一种基于医疗发票的大写数字对接方法、装置、设备及存储介质。所述方法包括:对医疗发票进行大写数字检测得到文本框对象集合;将所述文本框对象集合分组为锚点框对象与待对接框对象,根据所述锚点框对象与所述待对接框对象构建所述医疗发票的各个目标搜索框;根据目标搜索框中锚点框对象的对象类型对所述目标搜索框进行二次文本检索得到待选组合文本框,或进行文本检索得到待选文本框;根据所述待选组合文本框及所述待选文本框的坐标信息,拼接得到大写数字拼接结果。本发明可以在各类医疗发票识别过程中,提高发票中印刷体与打印体数字的识别对接准确性。
  • 基于多模态交叉注意力机制图文融合的情感分析方法-202310848751.8
  • 朱颢东;路延通;王建文;李展鹏;郭雅洁;李红婵 - 郑州轻工业大学
  • 2023-07-11 - 2023-10-03 - G06V30/413
  • 本发明提供一种基于多模态交叉注意力机制图文融合的情感分析方法,获取待处理的文本和图像;将文本进行向量化,得到文本特征;将文本特征经过BiLSTM处理,获取含有情感词汇的上下文特征;获取图像的图像特征,使用CBAM注意力分别从空间和通道两个方面获取图像特征中情感特征区域特征;对提取到的上下文特征和情感特征区域特征,通过交叉注意力机制进行融合,得到经过交叉注意力融合后的交叉特征,根据得到的交叉特征以及分类器,进行情感分类,得出情感分析结果。相较于现有的单模态情感分析方法,以及其他融合多模态的情感分析过程,分析结果更加准确,效果更好。
  • 一种表格识别方法、装置、设备及存储介质-202310662327.4
  • 邵俊;刘浩;钟权;王骏荣;张学钢 - 合肥联宝信息技术有限公司
  • 2023-06-05 - 2023-10-03 - G06V30/413
  • 本公开提供了一种表格识别方法、装置、设备及存储介质,涉及计算机技术领域。方法主要包括:对待识别表格对应的表格图像进行单元格扫描,得到扫描结果,扫描结果包括单元格图片以及单元格的第一顶点坐标和第二顶点坐标;根据第一顶点坐标,判断待识别表格中是否存在复杂表头,得到第一判断结果,第一判断结果包括待识别表格中表头单元格的编号;根据第一顶点坐标、第二顶点坐标和第一判断结果,对待识别表格的单元格进行结构遍历,得到待识别表格对应的表格结构信息;对单元格图片进行文本检测,得到待识别表格对应的单元格文本信息。本公开能够确定复杂表头和合并多行的单元格,提高表格识别的精确性。
  • 文本定位的方法、装置、计算机设备及存储介质-201910606491.7
  • 苏智辉;孙强 - 平安科技(深圳)有限公司
  • 2019-07-05 - 2023-10-03 - G06V30/413
  • 本发明实施例提供一种文本定位的方法,属于计算机技术领域。该文本定位的方法包括接收待识别的背景图片;选用预先训练好的文本划分模型识别该背景图片中的文本信息的位置,该文本划分模型为通过实例分割网络Mask‑RCNN创建的模型;若识别出该背景图片中包含有文本信息,则输出该文本信息的位置,否则,输出该背景图片未包含文本信息的提示。本申请突破了现有的对文字的文本框进行划分的方法,改进为根据文字的笔画进行文本划分,通过机器学习得到文本识别模型,利用该文本识别模型将背景图片中文字的边界划分出来,可以有效的在背景图片中划分出包围各文本的边界,并大大地减少了网络中有些文本字段被误切分以及误融合的情况,提高文本识别精度。
  • 识别模型的训练方法、图纸中的信息表的识别方法-202310945166.X
  • 崔羚;吴巍;董春龙;王树昂;郑喆誉;叶军楚;郭云峰;徐敏 - 中国核工业第五建设有限公司
  • 2023-07-28 - 2023-09-29 - G06V30/413
  • 本发明涉及针对用于识别图纸中的信息表的识别模型的训练方法、图纸中的信息表的识别方法、图纸中的信息表的识别装置以及计算机可读存储介质。训练方法包括:通过识别模型识别图纸中信息表获得物项的名称识别信息、属性识别信息以及类别识别信息,其中,信息表包含物项的名称、以及分别包含物项全部属性的描述文字;调用物项信息库,包含物项的名称、属性以及类别;根据名称识别信息、属性识别信息、类别识别信息与物项信息库中的物项的名称、属性、类别比对结果,调整识别模型的参数;生成训练后的识别模型。通过结合具体领域与图纸中物项的知识进行深度融合,识别物项的每个属性和类别,提高对图纸信息表的识别置信度,形成字段级别的审查纠错。
  • 一种基于文本分析模型的辅助文本生成方法、系统及设备-202310471230.5
  • 陈刚 - 上海晏鼠计算机技术股份有限公司
  • 2023-04-27 - 2023-09-29 - G06V30/413
  • 本发明公开了一种基于文本分析模型的辅助文本生成方法、系统及设备,该方法包括以下步骤:获取用户待生成文本所需的汇入文本资料;包括:文件夹内同一层级的文件、文件夹中子目录内的文件;对所述文本资料进行大纲抽取;对所述文本资料中的不同文本之间、文本内容之间计算文段相似度;根据文本分析模型对所述文本资料中的文本内容进行分类;根据分类结果形成段落内容库,在用户创作过程中,推荐相应文段内容以便实现辅助文本生成。该方法通过对用户上传的文本,用个性化模型进行训练,生成满足用户需求的文本参考库。通过推荐大纲、段落的方式,帮助用户创作出逻辑严密、表达清晰、细节生动的文本;利于提高用户的工作效率。
  • 一种文本检测方法、装置和计算机设备-201910188639.X
  • 王杰;李明键;钮毅 - 杭州海康威视数字技术股份有限公司
  • 2019-03-13 - 2023-09-29 - G06V30/413
  • 本申请提供一种文本检测方法、装置和计算机设备。本申请提供的文本检测方法,包括:从包含文本的待检测图像中获取指定信息,将所述指定信息输入到预先建立的用于构建图像中的文本与关注目标之间的空间关系的目标神经网络,由所述目标神经网络输出空间信息,依据所述空间信息对所述候选文本区域进行校正,得到所述待检测图像中的终选文本区域。其中,所述指定信息包括从所述待检测图像中定位出的候选文本区域的特征向量,所述关注目标包括所述图像中的文本、所述图像中与所述文本存在空间关系的指定目标和所述图像的属性信息中的至少一项。本申请提供的文本检测方法、装置和计算机设备,可准确地定位待检测图像中的文本区域。
  • 基于图卷积神经网络的文本关系检测方法、装置及存储介质-202110224515.X
  • 熊玉竹;侯绍东;周以晴 - 苏州美能华智能科技有限公司
  • 2021-03-01 - 2023-09-29 - G06V30/413
  • 本申请涉及一种基于图卷积神经网络的文本关系检测方法、装置及存储介质,属于计算机技术领域,该方法包括:获取目标图像中文本信息的多个关键信息块,关键信息块中的每个文本块包括至少一个字符串;将每个关键信息块中每个文本块的字符串输入节点特征提取模型,得到关键信息块的节点特征;构建关键信息块中的每个文本块与其它关键信息块中各个文本块之间的连通关系;基于每个关键信息块对应的各个连通关系、以及每个连通关系对应的位置信息,确定关键信息块的边特征;将节点特征和边特征输入预先训练的图卷积神经网络,得到各个关键信息块之间的边类型;确定边类型相同的关键信息块具有关联关系;可以提高关联关系识别的准确性和效率。
  • 文本检测模型的训练方法及装置、文本检测方法及装置-202110587997.5
  • 陈毅;谢群义;钦夏孟;姚锟 - 北京百度网讯科技有限公司
  • 2021-05-27 - 2023-09-29 - G06V30/413
  • 本公开提供了一种文本检测模型的训练方法,涉及人工智能领域,尤其涉及计算机视觉和深度学习领域。具体为:获取带有文本标注框的样本图像,其中,上述文本标注框用于标注上述样本图像中包含的文本主体上的目标文本;将上述样本图像输入初始文本检测模型,以执行以下操作:进行主体检测,得到上述文本主体的位置信息;进行特征提取,得到第一样本特征图;基于上述位置信息和上述第一样本特征图,进行特征融合,得到第二样本特征图以及上述文本标注框内各像素点的角度信息;以及基于上述第二样本特征图和上述角度信息以及预先设定的损失函数训练上述初始文本检测模型。本公开还提供了一种文本检测方法及其装置、一种文本检测模型的训练装置。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top