[发明专利]一种适用于文本识别纠错的方法及装置在审

专利信息
申请号: 202310560184.6 申请日: 2023-05-18
公开(公告)号: CN116563853A 公开(公告)日: 2023-08-08
发明(设计)人: 戴菀庭;罗奕康;聂砂;王伊妍;丁苏苏;郑江 申请(专利权)人: 中国建设银行股份有限公司;建信金融科技有限责任公司
主分类号: G06V30/12 分类号: G06V30/12;G06V30/19;G06F16/332;G06N20/00
代理公司: 北京市兰台律师事务所 11354 代理人: 窦雅利
地址: 100033 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种适用于文本识别纠错的方法及装置,该方法通过获取第一文本清单;将待识别的目标文本输入至文本检测模型,获取所述目标文本识别结果;将所述目标文本识别结果中置信度高于预设阈值的第一文本内容补充至所述第一文本清单,获得第二文本清单;将所述目标文本识别结果输入至训练字形相似度模型,获得字形相似度函数;将所述目标文本识别结果中置信度低于预设阈值的第二文本内容进行纠错处理,能够将置信度高于阈值的识别结果加入现有的非全量文本清单进而获得全量文本清单,能够实现对文本识别产生的错误进行精准的纠正。
搜索关键词: 一种 适用于 文本 识别 纠错 方法 装置
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司;建信金融科技有限责任公司,未经中国建设银行股份有限公司;建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202310560184.6/,转载请声明来源钻瓜专利网。

同类专利
  • 车牌图像完整性的检测方法以及系统-202310858714.5
  • 闫军;王莹莹;王艳清 - 智慧互通科技股份有限公司
  • 2023-07-13 - 2023-10-27 - G06V30/12
  • 本发明公开一种车牌图像完整性的检测方法以及系统,涉及图像处理技术领域。对原始车牌数据集中每个原始车牌图像进行图像预处理,获得预处理图像;对每个预处理图像进行边缘检测,获得边缘信息图像,并对每个边缘信息图像进行轮廓信息提取,获得图像轮廓信息;根据图像轮廓信息与标准车牌轮廓信息,判断车牌边框轮廓与车牌字符轮廓是否完整;若车牌字符轮廓完整或者车牌边框轮廓完整且车牌字符轮廓完整,则根据车牌遮挡模型检测对应的原始车牌图像是否存在遮挡;若不存在遮挡,则原始车牌图像为完整车牌图像。本方法从车牌图像的结构和内容的完整性分别进行判别,实现了多维度完整性检测,为车牌图像分析提供了高质量的图像数据。
  • 一种车牌识别中漏检字符查找方法、系统及电子设备-201911321524.X
  • 孙缵;陈毅成;张明宇 - 武汉瑞纳捷半导体有限公司
  • 2019-12-20 - 2023-10-27 - G06V30/12
  • 本发明涉及图像识别处理技术领域,公开了一种车牌识别中漏检字符查找方法、系统及电子设备,该查找方法首先获取车牌的字符信息;根据所获取的字符信息确定字符个数,并确定字符矩形的计算范围;根据所确定的计算范围,计算其中所有字符矩形的平均高度和平均宽度;将所有字符矩形的中心点进行直线拟合,并计算出直线系数;根据所得到的平均高度、平均宽度和直线系数,对漏检字符进行查找。本发明能够快速的查找出漏检的字符,还能获得字符的准确定位,提高了车牌识别的准确度。
  • 基于关键点引导的拍照文档弯曲矫正方法及设备-202311017033.2
  • 王秋锋;张伟光 - 西交利物浦大学
  • 2023-08-14 - 2023-10-27 - G06V30/12
  • 本申请涉及文档识别技术领域,尤其涉及一种基于关键点引导的拍照文档弯曲矫正方法及设备,方法包括:输入弯曲文档图片;构建基准稀疏控制点预测模块实现对基准控制点的预测;构建稠密3D形状预测模块,并对基于形变梯度的关键点进行提取;构建自底向上的文本行聚类模块,对基于邻近文本行的内容关键点进行提取;基于得到的形变关键点和内容关键点,将这些关键点对齐到2D的基准控制点网格中,最终实现多层次的控制点融合;在局部关键点引导下对多层次控制点进行修正处理,并输出矫正后的文档。本申请灵活地解决了弯曲文档矫正问题。
  • 一种图像文字识别的纠错方法、纠错装置、设备及介质-202310792032.9
  • 周俊;李学勇;何海清;姜超 - 渤海银行股份有限公司
  • 2023-06-30 - 2023-10-20 - G06V30/12
  • 本申请提供了一种图像文字识别的纠错方法、纠错装置、设备及介质,所述方法包括:从原始文字图像中提取待纠错文本,并将待纠错文本输入到统计语言模型中,确定出待纠错文本中的多个待纠错字符以及每个待纠错字符对应的多个候选字符;针对于每个待纠错字符,将该待纠错字符与该待纠错字符对应的每个候选字符之间的字符相似度特征输入到预先训练好的可替换概率预测模型中,确定出每个候选字符的可替换概率;基于每个候选字符的可替换概率从多个候选字符中确定出替换该待纠错字符的目标字符,并基于目标字符对该待纠错字符进行纠错,以得到纠错后文本。通过所述方法及装置,提高了图像文字识别的准确率,同时提高了对错误文字进行纠错的效率。
  • 基于文本纠错模型的文字识别方法及装置-202310912550.X
  • 周敏飞 - 中国工商银行股份有限公司
  • 2023-07-24 - 2023-10-20 - G06V30/12
  • 本申请实施例提供一种基于文本纠错模型的文字识别方法及装置,方法包括:对目标图像进行图像分割处理,对经过所述图像分割处理后的目标图像进行光学字符识别,得到初始文本识别结果;根据所述初始文本识别结果和设定文本纠错模型,得到目标文本识别结果,其中,所述文本纠错模型包含所述初始文本识别结果中每个字符相互之间的关联关系;本申请能够有效提高文字识别的准确率。
  • 一种基于中文字符级特征和语言模型的OCR纠错方法-202110571433.2
  • 张寅;刘书麟 - 浙江大学
  • 2021-05-25 - 2023-09-26 - G06V30/12
  • 本发明公开了一种基于中文字符级特征和语言模型的中文OCR纠错方法,所述方法包含如下步骤:1)训练一个OCR模型对中文图像进行识别,并伴以数据增强技术获取具有OCR后错误风格的数据;2)引入中文字符笔画结构信息以CBOW的方法进行词向量训练,使联合笔画结构词向量能够把握中文结构和笔画信息;3)以联合笔画结构词向量为基础构建语言模型来生成字符纠错候选集合。与现有的方法相比,本发明有如下益处:1)通过数据增强技术,能找到更多OCR后错误的显著特点,提高模型效果;2)能够解决笔画相同但字符结构不同的识别错误问题;3)能够在上下文信息不足的情况下,提高生成纠错候选集的质量。
  • 一种车险数据中车型名称智能校正方法和设备-202310639265.5
  • 王辉;王桂元;周瑞先 - 凯泰铭科技(北京)有限公司
  • 2023-06-01 - 2023-08-18 - G06V30/12
  • 本发明提供了一种车险数据中车型名称智能校正方法和设备,涉及数据处理技术领域,通过在车险合同模板库随机提取获得第一模板和第一模板特征信息,对第一模板特征信息进行分析得到定位输出结果,确定车险合同的车型名称位置并截取图片识别文字得到车型名称,对车型名称识别进行校正得到校正结果。解决了现有技术中车险合同信息校正检查基于人工,存在疏漏车型名称,导致车型名称错误合同无效,影响投保理赔的技术问题。达到了自动化进行车险合同中车型名称检查校正,保障车险合同正常生效的技术效果。
  • 一种字符图像处理方法、装置、设备和介质-202011004751.2
  • 曲福 - 北京百度网讯科技有限公司
  • 2020-09-22 - 2023-08-18 - G06V30/12
  • 本申请公开了一种字符图像处理方法、装置、设备和介质,涉及云计算技术领域。具体实现方案为:对目标图像中的字符进行识别,得到所述目标图像中的字符区域信息和字符形态信息;根据所述字符形态信息,对所述字符区域信息进行校准得到校准后的字符区域信息;根据校准后的字符区域信息,从所述目标图像中剔除字符。本申请实施例实现了对识别到的字符区域信息进行校准的效果,从而提高了字符区域信息的精准度,保证最终剔除字符的准确性。
  • 错字图像的生成方法、装置、设备及介质-202310562635.X
  • 王翔 - 深圳市星桐科技有限公司
  • 2023-05-18 - 2023-08-15 - G06V30/12
  • 本公开提供一种错字图像的生成方法、装置、设备及介质,其中该方法包括:获取目标单字的打印体标准图像;获取所述目标单字的打印体标准图像中待抹除的目标笔画的笔画信息;基于所述目标笔画的笔画信息执行抹除操作,以得到所述目标单字对应的打印体错字图像;对所述打印体错字图像进行风格迁移处理,以得到具有预设手写风格的手写体错字图像。本公开可以方便快捷地自动生成手写体错字图像,极大降低了错字图像的获取成本。
  • 一种适用于文本识别纠错的方法及装置-202310560184.6
  • 戴菀庭;罗奕康;聂砂;王伊妍;丁苏苏;郑江 - 中国建设银行股份有限公司;建信金融科技有限责任公司
  • 2023-05-18 - 2023-08-08 - G06V30/12
  • 本发明涉及一种适用于文本识别纠错的方法及装置,该方法通过获取第一文本清单;将待识别的目标文本输入至文本检测模型,获取所述目标文本识别结果;将所述目标文本识别结果中置信度高于预设阈值的第一文本内容补充至所述第一文本清单,获得第二文本清单;将所述目标文本识别结果输入至训练字形相似度模型,获得字形相似度函数;将所述目标文本识别结果中置信度低于预设阈值的第二文本内容进行纠错处理,能够将置信度高于阈值的识别结果加入现有的非全量文本清单进而获得全量文本清单,能够实现对文本识别产生的错误进行精准的纠正。
  • 字符缺陷检测方法、装置、设备及存储介质-202310395874.0
  • 姜龙;吕建涛;刘营军;宋贺 - 歌尔股份有限公司
  • 2023-04-14 - 2023-08-08 - G06V30/12
  • 本发明公开了一种字符缺陷检测方法、装置、设备及存储介质,包括获取包含待检测字符的待检测图像,并将待检测图像转换为与模板字符图像格式一致的格式待检测图像;对格式待检测图像中处于各个预设检测区域内的待检测字符进行检测,获得各个待检测字符的字符特征,各个预设检测区域基于模板字符图像中进行膨胀处理后的各个模板字符确定;将各个待检测字符的字符特征分别与所述模板字符图像中对应模板字符的特征进行对比,获得各个待检测字符的缺陷检测结果。提高了格式待检测图像中各个待检测字符定位的准确度和速度,实现了字符缺陷的自动检测,在提高了检测效率的同时,提高了缺陷字符检测的准确度。
  • 文本矫正方法及装置、电子设备及存储介质-202211645529.X
  • 崔元顺;许彬;林辉;段亦涛 - 网易有道信息技术(北京)有限公司
  • 2022-12-16 - 2023-08-01 - G06V30/12
  • 本发明的实施方式提供了一种文本矫正方法及装置、电子设备及存储介质。其中,方法包括:获取对目标对象进行扫描得到的扫描文本;将所述扫描文本输入轻量化bert语言模型中,得到所述扫描文本的目标语言特征,其中,所述轻量化bert语言模型的参数量少于标准Bert模型的标准参数量;按照所述目标语言特征对所述扫描文本进行第一矫正操作,得到第一矫正文本;根据所述第一矫正文本,得到对所述扫描文本完成矫正后的第二矫正文本。本申请克服了相关技术中不存在一种适用于轻量级离线化的OCR识别结果矫正技术的技术问题。
  • 手写汉字部件评测方法、装置、设备及存储介质-202310378859.5
  • 庄建明;施明勇 - 深圳市泓宇星科技有限公司
  • 2023-03-31 - 2023-07-07 - G06V30/12
  • 本发明公开一种手写汉字部件评测方法、装置、设备及存储介质,评测方法包括:构建汉字对应的部件组成查询表,部件组成查询表中包括在汉字构建中所对应的部件组成序列;构建汉字部件对应的笔顺查询表,笔顺查询表中包括在部件构建中所对应的笔顺序列;将收集的汉字的手写笔迹数据作为训练样本,将训练样本对应的部件组成序列和笔顺序列作为标签,训练得到部件识别模型;基于部件识别模型、部件组成查询表、笔顺查询表,获取待评测的手写汉字笔迹的评测结果。本发明基于部件识别模型进行汉字部件组成序列预测,适用于有着不同书写风格与书写习惯的用户,可以达到较高的准确率,帮助用户更快速地掌握汉字的正确书写方式。
  • 财务凭证信息自动识别方法-202310355672.3
  • 刘兰婷;陈明;刘咏晖 - 四川理和信企业管理有限公司
  • 2023-04-06 - 2023-07-04 - G06V30/12
  • 本发明公开了财务凭证信息自动识别方法,包括步骤一,检查凭证;步骤二,识别凭证种类;步骤三,识别凭证金额范围;步骤四、识别凭证金额数值;步骤五,凭证金额检测;步骤六,识别金额对比;步骤七,保存图片及信息。本发明通过对财务凭证纸张的颜色、大小与格式进行扫描识别,能够识别出凭证的种类与财务凭证的金额范围,通过对凭证上的金额进行扫描识别,并对扫描识别的金额和识别的凭证种类与金额范围进行对比,同时通过对凭证上记录的金额进行二次扫描识别,并对二次扫描识别的金额与第一次扫描识别的金额进行对比,可以避免发生扫描结果出现错误的情况,提高财务凭证信息识别更加准确。
  • 信息处理装置、其控制方法及存储介质-201810269570.9
  • 和田雄弘 - 佳能株式会社
  • 2018-03-29 - 2023-04-18 - G06V30/12
  • 本发明提供一种信息处理装置、其控制方法及存储介质。在通过使用具有照相机功能的移动终端来读取被摄体上的字符的情况下,在短时间内获取适合于OCR的图像。一种包括照相机的信息处理装置通过由照相机拍摄被摄体上的字符串来获取运动图像,所述信息处理装置针对构成所获取的运动图像的各个帧设置用于字符识别的搜索区域,所述用于字符识别的搜索区域针对构成字符串的各个字符,从搜索区域检测候选字符,确定指示检测到的候选字符的似然性的评估值是否稳定,并响应于评估值被确定为稳定,输出所获取的运动图像的帧。
  • 一种词典笔测试装置及测试方法-202210975984.X
  • 杨奇;杨锐豪 - 深圳市学之友科技有限公司
  • 2022-08-15 - 2023-03-21 - G06V30/12
  • 本发明涉及词典笔技术领域,且公开了一种词典笔测试装置,包括底盘,所述底盘的底部固定连接有支撑腿,所述底盘的上表面通过螺栓固定连接有固定支撑板,所述固定支撑板的外壁上通过螺栓固定连接有用于来回测试的驱动组件,所述驱动组件上设置有用于固定词典笔的测试机构,所述测试机构包括夹持组件和辅助稳定组件,所述夹持组件上设置有用于与词典笔接触的夹持块,通过测试机构带动词典笔向在测试板上滑动,进而对测试板上的内容进行识别,有效地实现了自动进行识别测试,减少了人工测试步骤的目的,通过机械运动能够稳定地带动词典笔进行识别测试,减少人工测试时出现无效测试的问题,进而提高了设备对词典笔测试的有效性。
  • 一种基于OCR识别结果的文本定位纠错方法系统-202211495374.6
  • 邵玉斌;张凤;龙华;杜庆治;张昊阁;祁雨婷;杨荣泰 - 昆明理工大学
  • 2022-11-27 - 2023-03-07 - G06V30/12
  • 本发明涉及一种基于OCR识别结果的文本定位纠错方法系统,属于自然语言处理和文字识别技术领域。首先在文本获取模块获取两份识别文本。接着在文本预处理模块对识别文本进行预处理。然后在待纠错字符定位模块利用LCSstr算法,将待纠错字符打上颜色标签,实现定位。接下来在断句提取模块对文本进行断句,利用Bigram模型计算句子困惑度,选择待纠错句子。之后在MLM模型纠错模块中,在预训练中引入形近字库,然后由模型得到待纠错字符的预测集。最后在字形匹配输出模块,计算待纠错字符与预测集关于笔画的字形相似度,得到最佳预测结果,输出修正文本。本发明通过对双引擎文字识别结果进行比对,实现对识别文本的有效纠错。
  • 基于多载体识别技术的钢卷顺序精准定位方法-201811460521.X
  • 刘敬;周海伦;安俊君;施子楷;韩东平;林娜;孙春阳;郭丽娟;郑旭;张银平;李波;梁玉 - 北京首钢自动化信息技术有限公司
  • 2018-12-01 - 2023-01-13 - G06V30/12
  • 基于多载体识别技术的钢卷顺序精准定位方法,涉及冶金行业的钢卷转运领域。根据现场实际需求和多种多载体识别技术的支撑,科学地规划并利用钢卷信息的数据流及逻辑关系,采用分流设计,避免信息堆积,提升钢卷信息跟踪效率。具体步骤包括钢卷信息自动识别、RFID标签精准定位及顺序判定、图像数据智能匹配、钢卷数据系统校验。该方法不仅有效减小因喷码错误、喷码质量和易混淆字符对喷码正确识别的影响,还大幅度降低因RFID标签粘贴位置、标签质量及周围环境等因素对识读设备识别范围内标签识别先后次序的影响,实现钢卷数据精准定位,全面提升物料信息的完整性与准确率,提高物料信息数据可靠性。
  • 空调压缩机型号识别方法及装置、介质、设备-202211239855.0
  • 刘小成;陈峰峰;刘皓;蒋思虎 - 四川虹美智能科技有限公司
  • 2022-10-11 - 2022-12-30 - G06V30/12
  • 本发明涉及一种空调压缩机型号识别方法及装置、介质、设备。方法包括:判断所述第一移动终端是否处于网络连接状态;若是,则扫描空调机身上的整合码,以获取所述整合码中的空调SN信息,并进入所述整合码对应的第一H5页面;其中,所述第一H5页面用于对所述空调的所属用户进行验证;通过所述第一H5页面对所述空调的所属用户进行验证,并在验证通过后,从云端中的第一映射关系数据库中获取所述空调SN信息对应的压缩机型号,并展示所述压缩机型号;其中,所述第一映射关系数据库中预先存储有多条第一映射关系,每一条第一映射关系中包括一个压缩机信号和一个空调SN信息。本发明风险成本较低,提高了压缩机型号识别的效率。
  • 一种路牌字符的识别方法和装置-202211324253.5
  • 李正旭;朱磊;贾双成 - 智道网联科技(北京)有限公司
  • 2022-10-27 - 2022-12-23 - G06V30/12
  • 本申请涉及图像识别技术领域,更具体的说是涉及一种路牌字符的识别方法和装置,方法包括:在目标图像中裁剪出包含待识别路牌字符的第一子图像;将所述第一子图像处理成只包含黑色和白色的第二子图像;判断所述第二子图像中黑白分布区域是否满足预设的区域分布条件;若是,识别所述第二子图像中的路牌字符,生成识别结果;若否,扩大裁剪区域,返回所述裁剪出目标图像中包含待识别路牌字符的第一子图像的步骤;通过这种方式,能够有效的改善路牌字符提取不全的问题,从而提高了路牌字符提取的准确度。
  • 证件机读码纠偏方法、存储介质-202211040457.6
  • 张晓燕;赖文辉;林志伟;张登峰 - 福建升腾资讯有限公司
  • 2022-08-29 - 2022-12-02 - G06V30/12
  • 本申请提供证件机读码纠偏方法、存储介质,方法包括:依据证件规范对机读码进行切割,得到多个的识别对象;若一识别对象存在一个缺损字符,则依据成功识别出的已知字符,使用731加权法计算获取缺损字符;若一识别对象存在两个缺损字符,则依据识别结果确定各个缺损字符对应的权位和对应的至少两个的可能字符,其中,若缺损字符为校验位,则设定其对应的权位为校验位标识值;依据成功识别出的已知字符、所述权位和所述至少两个的可能字符,使用731加权法确定各个缺损字符。本申请能够在无法读取完整机读码时,对缺损的字符进行精确且高效地纠偏。
  • 一种数据识别方法及移动终端-202210679114.8
  • 房浩;卞雪达 - 京东方科技集团股份有限公司
  • 2022-06-15 - 2022-09-09 - G06V30/12
  • 本公开提供了一种数据识别方法及移动终端,用于在扫描显示设备显示的待识别数据时,通过校验码对扫描数据进行校验,从而提高识别结果的准确率。该方法包括:对显示的待识别数据进行至少一次扫描;其中每次扫描执行如下步骤:利用本次扫描得到的扫描数据生成本次的校验码,利用本次的校验码对本次的扫描数据中的第一数据进行校验;当校验通过时停止扫描,确定所述待识别数据的识别结果为本次的扫描数据中的第一数据。
  • 一种汉藏英多语种OCR光字符识别系统-202210681097.1
  • 欧珠;边巴卓玛;丹增阿旺;旦增念扎;谢志东 - 西藏查瓦云科技有限责任公司
  • 2022-06-15 - 2022-08-30 - G06V30/12
  • 本发明公开了一种汉藏英多语种OCR光字符识别系统,涉及OCR光字符识别设备技术领域,包括光字符识别装置主体,所述光字符识别装置主体的内部设置有字符识别机构,所述字符识别机构包括有OCR光字符扫描采集器,所述OCR光字符扫描采集器的内部设置有字符图像采集模块。本发明通过利用OCR光字符扫描采集器中的字符图像采集模块与外置摄像头的配合,对纸质文件上的汉藏英文字字符进行扫描,并将其储存,然后配合字符识别模块和字符分类比对模块进行文字字符的比对,再与汉藏英字符库中的相关字符对比印证,将比对结果发送至OCR光字符识别主机进行储存和显示,实现汉藏英多语种字符的高效识别与比对互译。
  • 一种藏文手写识别技术方法与系统-202210681109.0
  • 欧珠;边巴卓玛;丹增阿旺;旦增念扎;谢志东 - 西藏查瓦云科技有限责任公司
  • 2022-06-15 - 2022-08-30 - G06V30/12
  • 本发明公开了一种藏文手写识别技术方法与系统,涉及文字识别技术领域,该藏文手写识别技术方法,由以下步骤组成,步骤一、藏文数据库建立,步骤二、目标藏文笔迹识别,步骤三、笔迹多级对比。本发明通过采用弹性套壳、静电连接块、静电导杆、静电汇聚导板、弹性连接绳以及静电传导柱之间的配合,当识别装置主体对弹性套壳产生挤压作用,使得弹性套壳发生弹性形变时,静电汇聚导板底部固定连接的静电传导柱会与连接槽的内壁活动连接,并通过静电连接块以及静电导杆的作用,将识别装置主体携带的静电导出,通过静电汇聚导板汇聚,经静电传导柱导出分散至静电导出板中,再通过静电导出板将导出的静电导入至静电储存块中进行储存。
  • 一种书写内容的矫正方法、终端设备以及可读存储介质-202110216690.4
  • 杨昊民 - 广东艾檬电子科技有限公司
  • 2021-02-26 - 2022-08-30 - G06V30/12
  • 本发明实施例公开了一种书写内容的矫正方法、终端设备以及可读存储介质,用于终端设备在记录书写内容的过程中,通过预设算法能够及时对该书写内容进行矫正,以提高书写内容识别的准确性。本发明实施例方法包括:获取纸质书本面上的第一矩形区域,并将第一矩形区域的第一边界作为第一基准线;在预设时长后,获取纸质书本面上的第二矩形区域,以及第二矩形区域的第二边界;获取第二边界与第一基准线之间的第一角度;当第一角度位于预设角度范围之外时,通过预设算法将第二书写内容进行矫正,以使矫正后的第二书写内容对应的已答题区域的第二边界,与第一基准线之间的第二角度位于预设角度范围内;其中,第一边界与第二边界对应。
  • 字符串相似度的确定方法、装置、存储介质及电子设备-202210456248.3
  • 高爽笑;李飞;武春杰;荣刚 - 联宝(合肥)电子科技有限公司
  • 2022-04-27 - 2022-08-26 - G06V30/12
  • 本发明公开一种字符串相似度的确定方法,该方法包括:获取识别字符串和目标字符串,并确定识别字符串的长度和目标字符串的长度;若识别字符串需要变换操作转换为目标字符串,则根据变换操作的最少变换步数和变换操作的权重确定识别字符串与目标字符串的编辑距离;所述变换操作包括插入、删除、替换中的一种或多种,且不同变换操作的权重不同;根据识别字符串的长度、目标字符串的长度、编辑距离,确定识别字符串与目标字符串的相似度。本方案不需要对识别字符串进行切分,也不需要引入纠错字典辅助判断,因此识别字符串和目标字符串的相似度的确定效率更高;另外本方案通过给不同的变换操作分配不同的权重,相似度的准确率更高。
  • 基于生成网络的自然场景扭曲文本图像矫正方法及系统-202110126410.0
  • 茅耀斌;刁洁;项文波;卓一;韩翊;徐安丽;吴敏杰;张伟 - 南京理工大学;浙江华云信息科技有限公司
  • 2021-01-29 - 2022-08-16 - G06V30/12
  • 本发明公开了一种基于生成网络的自然场景扭曲文本图像矫正方法及系统,方法包括:1)扭曲数据增广。在平展文本图像上设置基准点,增广模块通过基准点的运动变换扭曲图像,代理网络与识别网络共同优化使扭曲文本识别难度较大,数据增广以后可获得成对的“平展‑扭曲”文本图像。2)搭建矫正网络。包括平展生成器、判别器,扭曲生成器、判别器,同时在损失函数中引入梯度先验损失,生成清晰度更高的矫正后图像。3)训练矫正网络。使用双向循环方式训练矫正网络。4)应用推理。利用训练后的矫正网络将待处理的自然场景扭曲文本矫正为平展文本。本发明能够有效消除自然场景文本的空间扭曲变形,得到的平展文本清晰度较高,提升了后续识别的精度。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top