[发明专利]一种基于激活力模型的图片中文本识别纠错方法有效

专利信息
申请号: 201610458328.7 申请日: 2016-06-22
公开(公告)号: CN106127265B 公开(公告)日: 2018-02-06
发明(设计)人: 马占宇;周环宇;司中威 申请(专利权)人: 北京邮电大学
主分类号: G06K9/68 分类号: G06K9/68;G06K9/20
代理公司: 暂无信息 代理人: 暂无信息
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明实施例公开了一种基于激活力模型的图片中文本识别纠错方法。该方法包括如下步骤字典构建步骤构建激活力字典,旨在挖掘汉字间的相互影响关系,从而获得各个汉字前方以及后方可能出现的其他汉字。不确定字纠正步骤使用通用方法获取识别出的字符以及对应的识别相似度,若其中存在某一字符的相似度高于选定阈值的,认为识别正确;若不存在,则将这些字符以及相似度作为参考先验概率,并利用构建的字典并结合贝叶斯公式筛选出最佳字。利用本发明实施例,能够提高图片文本识别的正确率,具有很大的实用价值。
搜索关键词: 一种 基于 激活 模型 图片 文本 识别 纠错 方法
【主权项】:
一种基于激活力模型的图片中文本识别纠错方法,其特征在于,包括以下步骤:字典构建步骤:构建激活力字典,旨在挖掘汉字间的相互影响关系,从而获得各个汉字前方以及后方可能出现的其他汉字;不确定字纠正步骤:使用通用方法获取识别出的字符以及对应的识别相似度,若其中存在某一候选字符的相似度高于设定阈值,认为其对应的候选字符识别正确;若不存在,则将这些字符以及相似度作为参考先验概率,利用构建的字典并结合贝叶斯公式筛选出最佳字;其中,不确定字纠正步骤中,假定已经通过通用方法获取了字符i的识别结果wi和对应的相似度λi,其中wi=[wi1,wi2,…,win]T,wix为识别出的可能的字符,λi=[λi1,λi2,…,λin]T,λix为对应的相似度,此步骤具体过程如下:1)当存在λix大于θ时,认为对应的wix即为正确的识别结果;当不存在时,首先滤除λix小于对应的字符,将剩下的作为候选字符;2)对于待识别字符i的候选字符集合为w′i=[wi1,wi2,…,wim]T,对于前后都存在已确定相邻字的字符i的某一候选识别字wij的后验概率ηij可以定义如下ηij=lg((afAwij+α)(afWijB+α)-α+1)]]>其中,A为字符i前面的相邻字,B为字符i后面的相邻字,α为平滑因子,同理,对于只存在一边相邻字的后验概率ηij可以定义为或者利用贝叶斯公式ψij=λijηijΣkλikηik]]>则选择最大的ψij作为字符i的识别结果,即Ψi=maxj(ψij)]]>Ψi即为字符i的识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610458328.7/,转载请声明来源钻瓜专利网。

同类专利
  • 一种针对手写物流单据的信息识别存储方法-201910568041.3
  • 张谯宁;王磊;刘涵;陈冬冬 - 亳州职业技术学院
  • 2019-06-27 - 2019-11-05 - G06K9/68
  • 本发明公开一种针对手写物流单据的信息识别存储方法,本发明涉及信息识别存储领域,先识别该物流单据类型,再根据该物流单据模板划分板块,进行分块识别,提高识别效率和识别准确率,然后进行信息确认,最后录入存储;本发明不仅识别手写文字,还通过格式判断、不同信息栏中手写信息相互比对来判断信息是否准确,大大提高了准确率,本发明先智能识别并标注问题,再经由工作人员作最终确认,即辅助工作人员提高效率,又保证了信息准确。
  • 多卷积层驱动的深度信念网络书法风格识别方法-201910571868.X
  • 张九龙;刘一波;屈晓娥 - 西安理工大学
  • 2019-06-28 - 2019-10-15 - G06K9/68
  • 本发明公开了一种多卷积层驱动的深度信念网络书法风格识别方法,首先获得欧颜柳赵楷书四大家的原始书法作品并进行预处理,得到书法单字样本;将书法单字样本分成训练样本集和验证样本集;然后将训练样本集输入模型分类器并不断迭代训练,最终得到训练好的混合网络模型,同时使用验证样本集不断验证模型分类器;最后将书法单字样本输入训练好的混合网络模型中,再结合Softmax分类器完成书法风格识别。本发明解决了现有技术中存在的法字体分类困难的问题,同时本发明还能高分类的精准度。
  • 用于识别手写汉字的装置-201910118220.7
  • 杨林;董子拓;杨晋;董子翔;张文涵;孙宝华 - 海青智盈技术公司
  • 2019-02-16 - 2019-10-11 - G06K9/68
  • 一种用于识别手写汉字的装置,包含:总线;连接到总线的输入装置,用于接收根据手写汉字创建的输入图像数据;基于细胞神经网络或细胞非线性网络(CNN)的集成电路,可操作地连接到总线,用于使用存储在其中的多个有序的卷积层的预训练滤波器系数而从输入图像数据中提取特征;连接总线的存储器,该存储器被配置用于存储完全连接(FC)层的权重系数;连接到总线的处理单元,用于执行FC层的计算,以将来自基于CNN的集成电路中提取的特征分类为预定义的汉字集中的特定汉字;以及连接到总线的显示单元,用于显示特定汉字。使用多个双值3×3滤波器内核作为预训练滤波器系数,实现了大于95%的识别准确率。
  • 一种双判别器GAN的古彝文字符修复方法-201910599249.1
  • 陈善雄;朱世宇;韩旭;邱小刚;林小渝 - 西南大学
  • 2019-07-04 - 2019-10-08 - G06K9/68
  • 本发明提供一种双判别器GAN的古彝文字符修复方法,所述方法包括:构造由彝文字符生成器和彝文字符判别器组成的DCGAN网络模型,在该网络模型基础上增加一个筛选判别器,形成一种双判别器GAN模型;通过所述双判别器GAN模型实现从多源相关手写彝文中获取彝文字符图像的概率分布,通过已获得的概率分布去预测待修复彝文字符图像,根据预测图像完成彝文字符修复。本发明的双判别器GAN是在深度卷积生成对抗网络的基础上,增加一个彝文筛选判别器,通过两个阶段的训练对彝文字符生成模型进行迭代优化,从而获取待修复彝文的完整图像,能够有效提升古彝文字符修复的效率。
  • 基于图片的字体识别方法、装置、电子设备及存储介质-201910563421.8
  • 张水发;李岩 - 北京达佳互联信息技术有限公司
  • 2019-06-26 - 2019-09-24 - G06K9/68
  • 本公开关于一种基于图片的字体识别方法、装置、电子设备及存储介质,通过将待处理图片进行处理,分别得到两种不同分辨率的图片,将两种不同分辨率的图片分别输入两个独立的卷积神经网络进行特征提取,可以同等对待不同分辨率的图片,使网络对较低分辨率的图片也有很好的解析力,提高了模糊图片中对字体的识别效果,最终提高了模糊图片的识别准确率,利用预先训练的深度学习网络获取图片中字体的特征信息,捕捉到模糊图片中的字体局部关键信息,提高模糊图片中字体识别的准确率。
  • 一种结合局部不对称几何的多模型拟合方法-201910418340.9
  • 王菡子;郭翰林;严严;林舒源;罗海玲 - 厦门大学
  • 2019-05-20 - 2019-09-20 - G06K9/68
  • 一种结合局部不对称几何的多模型拟合方法,涉及计算机视觉技术。能够利用数据点之间更多的信息,即每个数据点的局部邻居不对称性适合于建模数据点之间的关系。首先,考虑几何空间的关系,搜索每个数据点的空间邻域,以及在空间邻域中计算数据点之间的相似性,从而生成一个有向图。接着,基于该有向图,计算数据点之间的路径相似性。特别是,所构造的有向图对噪点更加的鲁棒。最后,提出自适应二分有向图,从而生成一个二值图,该有向图有效地提升了,所提出的方法在估计模型实例时的计算效率。
  • 一种手写文本识别方法及装置、电子设备-201910349751.7
  • 韩茂琨;回艳菲;陈玥蓉;王健宗 - 平安科技(深圳)有限公司
  • 2019-04-28 - 2019-09-06 - G06K9/68
  • 本发明涉及文字识别技术领域,揭示了一种手写文本识别方法及装置、电子设备,所述方法包括:获取待识别的手写文本图像;利用训练得到的卷积神经网络模型的卷积层对手写文本图像进行高阶特征提取,获得特征数据;通过卷积神经网络模型的递归块对特征数据进行序列化处理及对序列化处理得到的序列化数据进行深度方向的串联处理,获得串联序列化数据;通过卷积神经网络模型的线性层将串联序列化数据映射到输出标签,获得输出值;根据输出值和预设语义库获取手写文本图像对应的目标文本,通过卷积神经网络模型识别出手写文本图像对应的目标文本,能够在不影响检测精度的前提下,极大地减少计算成本,提高模型的训练速度和识别速度。
  • 一种基于局部协作表示分类的手写汉字识别方法-201910521515.9
  • 刘烜;黄洪琼 - 上海海事大学
  • 2019-06-17 - 2019-09-06 - G06K9/68
  • 本发明提供一种基于局部协作表示分类的手写汉字识别方法,包含步骤:S1、选取手写汉字库,提取所述手写汉字库中所有手写汉字的特征向量并分类,建立特征向量集A;提取待识别手写汉字的特征向量y;S2、在每类特征向量中找出与y最相似的一个特征向量,建立字典D1;S3、求解y在D1中的协作稀疏表示向量通过求取y对D1的第一重构残差;根据所述第一重构残差选取特征向量集A中的N类特征向量建立字典D2;S4、求解y在D2中的协作稀疏表示向量通过求取y对D2的第二重构残差,根据所述第二重构残差判断y对应于A中特征向量类别,实现识别手写汉字。本发明缩小了识别手写汉字时所用字典的规模,在减少算法时间复杂度的同时也提高了识别精度。
  • 一种基于笔划编码的印刷体汉字识别方法-201610352919.6
  • 尤新革;李政;陈鹏旭 - 华中科技大学
  • 2016-05-25 - 2019-08-30 - G06K9/68
  • 本发明公开了一种基于笔划编码的印刷体汉字识别方法,包括如下步骤:(1)根据汉字笔划对汉字进行编码;根据编码结果建立笔划编码数据库;(2)提取汉字库中各字符图像的LBP特征;(3)使用svm分类器学习汉字的编码,以获得学习器;(4)使用所述学习器对待识别汉字的字符图像进行预判,获取笔划编码;(5)将预判获得的笔划编码与笔划编码数据库里所有的笔划编码进行匹配,匹配成功的笔划编码所对应的汉字即为识别结果;本发明公开的这种印刷体汉字识别方法,基于笔划编码进行汉字识别,使用特征学习的方法空间映射预判,笔划编码特征向量只由25位二进制编码表示,具有识别速度快,识别精度高的特点。
  • 字符图片处理方法和装置-201510653925.0
  • 刘昉;夏立宁 - 北大方正集团有限公司;北京北大方正电子有限公司
  • 2015-10-10 - 2019-08-30 - G06K9/68
  • 本发明提供一种字符图片处理方法和装置,该方法包括:接收待处理字符图片和待处理字符图片中字符的特征笔画;识别字符的轮廓,生成字符轮廓图片,获取字符轮廓图片对应的数据集合;从数据集合中确定与特征笔画的特征笔画数据子集合,根据特征笔画数据子集合生成特征笔画图片;从存储各字体类别分别对应的各参考特征笔画数据的数据库中,选择与特征笔画对应的各类字体类别下的参考特征笔画数据,生成与各参考特征笔画数据对应的参考特征笔画图片;计算特征笔画图片与各参考特征笔画图片的相似度,确定具有最高相似度的参考特征笔画图片所对应的字体类别为待处理字符图片中字符所属的目标字体类别,从而方便高效地匹配出字符图片中字符的字体。
  • 一种基于图像二值化的书法比对方法-201910029749.1
  • 朱齐媛;孟祥丽 - 岭南师范学院
  • 2019-01-14 - 2019-07-12 - G06K9/68
  • 本发明公开了一种基于图像二值化的书法比对方法,其特征在于,该方法包括:步骤1为将书法练习者的书法图片用图像二值化原理处理为二值化图,设为图a;步骤2为将字帖的图片用图像二值化原理处理为二值化图,设为图b;步骤3为将步骤1处理得到的图a与步骤2处理得到的图b进行图片大小处理,将两图的尺寸大小调整为一致;步骤4为选择对比方向,判断选择强调汉字结构对比或强调汉字笔画对比;步骤5为比对效果显示;步骤6为通过深度学习给出练习者练习的参考意见。本发明的书法比对方法给出的图像、文字或者是数字的对比结果非常直观,可以方便练习者领悟到自己的字体与字帖的不同之处,给出练习者练习书法的参考意见。
  • 电子笔迹的单字拆解方法及装置-201610511546.2
  • 张明云 - 广东小天才科技有限公司
  • 2016-06-30 - 2019-06-14 - G06K9/68
  • 本发明适用于计算机技术领域,提供了电子笔迹的单字拆解方法及装置,包括:获取用户手写输入的电子笔迹;根据本次书写过程对应的汉字序列中每个汉字的笔画数,将所述电子笔迹拆解成多个分组,得到第一拆解结果;判断每个所述分组的笔画类型是否与所述汉字序列中对应汉字的笔画类型相匹配;若每个所述分组的笔画类型均与所述汉字序列中对应汉字的笔画类型相匹配,输出所述第一拆解结果;若每个所述分组的笔画类型并非均与所述汉字序列中对应汉字的笔画类型相匹配,按照笔画间隔对所述电子笔迹进行拆解,得到并输出第二拆解结果。本发明极大地减轻了终端设备的运算压力,提高了电子笔迹单字拆解的运行效率。
  • 一种基于神经网络的手写识别系统、装置和移动终端-201510064058.7
  • 郑介誌;林福辉 - 展讯通信(上海)有限公司
  • 2015-02-06 - 2019-05-28 - G06K9/68
  • 本发明公开了一种基于神经网络的手写识别系统、装置和移动终端,属于神经网络技术领域;系统包括采集装置、识别装置和结果反馈装置;其中识别装置通过以多行多列排布并相互关联的多个神经单元模块块处理形成的神经网络模型对外部输入的手写字符的图像进行识别;外部输入的手写字符的图像被转换成相应的时间脉冲序列并发送至所述识别装置内。通过反馈结果对神经网络模型进行更新和学习,以训练形成适应于使用者个人书写习惯的神经网络模型。上述技术方案的有益效果是:减少数学处理模型处理数据的复杂度;减少向远程服务端传输的数据量,降低移动终端应用数学处理模型对网络带宽的依赖程度;提升数学处理模型应用于移动终端上的可能性。
  • 手写汉字的识别方法、装置、设备和存储介质-201811494875.6
  • 张志远;王庆乐 - 北京锐安科技有限公司
  • 2018-12-07 - 2019-04-23 - G06K9/68
  • 本发明实施例公开了一种手写汉字的识别方法、装置、设备和存储介质,其中该方法包括:获取待识别的手写汉字图片;利用预先构建的手写汉字识别模型,得到手写汉字图片的汉字,手写汉字识别模型的训练集为通过数据增强模型进行数据增强之后的训练集。本发明实施例通过数据增强模型对初始数据集进行数据增强得到数据增强之后的训练集,采用该数据增强之后的训练集训练好的手写汉字识别模型的准确率得到极大的提高,进而提高了手写汉字识别的准确率。
  • 字符识别方法、装置、设备及存储介质-201811254944.6
  • 周罡;王彬 - 平安科技(深圳)有限公司
  • 2018-10-25 - 2019-04-19 - G06K9/68
  • 本发明公开了一种基于大数据处理的字符识别方法、装置、设备及存储介质,所述方法包括:调用第一预设区域中预存的分词工具,以使所述分词工具将待识别文本划分为多个预设长度的参考字符;根据所述参考字符的目标长度在第二预设区域查找对应的预设词典,并判断所述预设词典中是否存有所述参考字符;在所述预设词典中未存有所述参考字符时,将未存有的参考字符通过模糊匹配算法筛选出目标字符。本发明通过预设词典判断字符是否存在识别异常的情况,在这种情况下,将异常字符通过模糊匹配算法筛选出目标字符,从而通过模糊匹配算法实现文字识别,提高文字识别效率。
  • 基于BLSTM的联机手写数学公式符号识别方法-201510860618.X
  • 黄双萍;金连文;商俊蓓 - 华南理工大学
  • 2015-11-30 - 2019-04-09 - G06K9/68
  • 本发明提供基于BLSTM的联机手写数学公式符号识别方法,对联机手写输入的数学公式,用隐性分割模型对数学公式符号进行处理及识别,然后进行公式分析。本发明基于双向长短时记忆递归神经网络模型设计联机手写数学公式符号识别过程,并使用时域连接模型标注输出的无分割公式序列。对多部件构成的复杂符号,根据ASCII码表转化成单字符标签,减少识别标签的不确定性,统一标签类型。本发明联机手写数学公式符号识别方法识别效果良好,不需对公式进行切分处理,减少了一般公式识别方法中的工作量。多部件复杂符号整体识别的方法有效,比单独识别的准确率有显著提高。
  • 实现任意方向书写文本行切分的方法及系统-201410038222.2
  • 胡金水;竺博;王智国;胡郁;刘庆峰 - 科大讯飞股份有限公司
  • 2014-01-26 - 2019-04-05 - G06K9/68
  • 本发明涉及手写识别技术领域,公开了一种实现任意方向书写文本行切分的方法及系统。该方法包括:将连续笔迹切分为文本片断序列;根据所述文本片断序列中两相邻文本片断的合并概率对所述文本片断序列进行合并处理;获取合并处理完成后的文本片断序列,并将其作为有效文本行序列;将所述有效文本行序列中的各文本片断独立成行。本发明可以在提高文本行切分准确率的同时,实现对用户书写区域内的任意方向随意写的支持。
  • 手写样本生成方法、装置、计算机设备及存储介质-201811084484.7
  • 金晨;刘克亮 - 平安科技(深圳)有限公司
  • 2018-09-18 - 2019-03-26 - G06K9/68
  • 本发明公开了一种手写样本生成方法、装置、计算机设备及存储介质。所述方法包括:获取手写输入法中的字体文件;获取文本语料文件;根据预设的图片尺寸绘制画布,并设置画布的背景颜色;从预设的语料数据库中提取语料文本,并从预设的字体库中选取目标字体文件;使用目标字体文件将语料文本转换为目标字体文件对应的手写文本;根据画布尺寸和手写文本,确定手写文本的文本尺寸;按照手写文本的文本尺寸,在画布上绘制手写文本,得到手写样本图片;将手写样本图片和语料文本作为手写样本,保存到手写样本数据集中。本发明的技术方案提高手写样本的收集效率,同时能够丰富手写样本的样本数量,进而有效提高手写文本识别模型的识别准确率。
  • 文字信息的识别方法和装置-201510033229.X
  • 李瑾;徐翔 - 百度在线网络技术(北京)有限公司
  • 2015-01-22 - 2019-03-12 - G06K9/68
  • 本发明提出了一种文字信息的识别方法和装置,其中,文字信息的识别方法,包括:接收用户输入的文字信息,并从文字信息中获取到对应的元素;基于元素生成识别结果集合;以及基于预设算法对识别结果集合中的识别结果进行处理,以输出目标识别结果。本发明实施例的文字信息的识别方法和装置,通过笔画预分割器准确地对用户输入的文字信息进行笔画分割获取到对应的元素,并根据相似度生成识别结果集合,以及根据预设语言模型构造马尔可夫链,获取其中生成概率最高的路径对应的信息作为目标识别结果,在用户不受限地在手写区域输入文字信息的情况下,能够准确地识别用户输入的文字信息,有效地提高了识别的准确率。
  • 文字评价方法及装置-201310488191.6
  • 李硕;高玉军 - 北大方正集团有限公司;北京北大方正电子有限公司
  • 2013-10-17 - 2019-03-08 - G06K9/68
  • 本发明提供一种文字评价方法及装置。本发明提供的文字评价方法,包括:接收用户输入的对文字的评价指令;根据所述评价指令读取所述文字的图形信息;根据所述图形信息对所述文字进行字形分析,获取所述文字的书写字形信息;根据所述书写字形信息和参考字形信息生成针对所述文字的评分值。本发明提供的文字评价方法可以获得针对书写文字的客观评价结果,解决了目前仅依据评价者主观判断的方式对书写文字进行评价的问题,提高了文字评价的可靠度。
  • 一种文字识别方法及其系统-201510738664.2
  • 冯清亮 - 冯清亮
  • 2015-11-02 - 2019-02-26 - G06K9/68
  • 本发明公开了文字识别方法及其系统,所述文字识别方法步骤包括输入待识别区域图像并进行二值化处理;提取待识别区域笔划特征;提取各笔划的近邻笔划及其相对位置关系特征;部件匹配;字匹配;输出待识别区域字匹配结果。所述文字识别系统包括图像采集模块、图像处理和文字识别模块和文字输出模块。本发明能对印刷体、较为工整的手写体字精准地识别,除了要求手写体字不能太潦草以致不能看出其文字结构特征外没有其它限制,能够高速、大批量地处理印刷体和手写体文稿、表格和票据等。
  • 一种基于网页智能检测网页文字的方法以及电子设备-201811261000.1
  • 李天驰;孙悦 - 深圳点猫科技有限公司
  • 2018-10-26 - 2019-02-22 - G06K9/68
  • 本发明公开一种基于网页智能检测网页文字的方法以及电子设备,方法包括:接收用户通过预设的快捷键启动文字识别工具的指令,启动文字识别工具并将所述文字识别工具应用于当前网页中;通过所述文字识别工具获取当前网页中目标位置上文字的格式信息,所述文字的格式信息包括文字字体、文字大小、文字粗细、文字颜色、文字行高和文字风格的一种或几种,并将文字的格式信息通过一显示框显示。这样,用户便不需要将网页文字复制至文字识别工具中,从而快速获取网页文字的格式信息,大大提高了效率,节约了时间。并且,本发明提供的方法更加简单、更加便捷以及更加高效。
  • 评价练字字帖中的书写字的方法及系统-201811179586.7
  • 柴胜;林玺磊;李正龙;赵智宇;陶海亮 - 北京一米蓝科技有限公司
  • 2018-10-10 - 2019-01-15 - G06K9/68
  • 本发明公开一种评价练字字帖中的书写字的方法,书写字由用户参照标准字帖书写得到,该方法包括:从练字字帖中提取每一个字的第一类特征和第二类特征,其中,第一类特征包括每一个字的X轴偏离度、Y轴偏离度和字体大小,第二类特征包括每一个字的灰度共生矩阵、LBP局部特征和HOG特征;根据第一类特征确定对练字字帖中的书写字的工整度评分;根据第二类特征确定对练字字帖中的字的平均评分;至少将工整度评分和平均评分呈现给用户以评价书写字。本发明实施例中,在评价书写字时不仅考虑了在字级别进行评分,还考虑了整个一页练字字帖上所有书写字所呈现出的整体工整度来进行整体评分,从而能够更加准确、合理的对书写字进行评价。
  • 一种手写汉字规范性评价方法及系统-201610008320.0
  • 何聚厚;高倩 - 陕西师范大学
  • 2016-01-07 - 2019-01-11 - G06K9/68
  • 本公开涉及一种手写汉字规范性评价方法及系统,所述方法包括构建汉字特征模板并记录相关字体信息;采集手写汉字字体信息;将采集到的手写汉字的笔画数N′与汉字特征模板中对应的汉字的笔画数N进行对比,若两者的笔画数不相等,则判定该手写汉字不符合规范;否则,进行手写汉字规范性评价,得出规范性评价结论以指导实际中的汉字书写。基于所述方法,实现了一种手写汉字规范性评价系统。所述方法及系统有益于克服人工评价汉字的主观性以及疲劳性带来的不利影响,可以很好地指导汉字初学者进行规范的汉字书写。
  • 一种多语种倾斜文档图像的自动语言判别方法-201610053497.2
  • 王恺 - 南开大学;天津神州浩天科技有限公司
  • 2016-01-27 - 2019-01-04 - G06K9/68
  • 本发明涉及一种多语种倾斜文档图像的自动语言判别方法,其技术特点是包括以下步骤:对于采集的文档图像,利用Gabor滤波方法进行文档图像语种的自动判别,将文档图像分为亚洲语种文档图像和拉丁语种文档图像;针对不同语种的文档图像使用相应的倾斜校正算法,得到校正后的文档图像,然后在校正后的文档图像上应用关键词匹配方法进行文档图像语言的自动判别,从而实现文档图像的语言自动判别功能。本发明设计合理,其采用Gabor滤波和关键词匹配相结合的方法实现了文档图像的自动语言判别功能,并且通过分块投票方式保证了方法的鲁棒性,提高了识别的准确率,准确率满足了实际应用的需求。
  • 中文模型训练、中文图像识别方法、装置、设备及介质-201810563508.0
  • 高梁梁;周罡 - 平安科技(深圳)有限公司
  • 2018-06-04 - 2018-12-28 - G06K9/68
  • 本发明公开一种中文模型训练、中文图像识别方法、装置、设备及介质,该中文模型训练方法包括:获取训练手写中文图像;将训练手写中文图像按预设比例划分成训练集和测试集;对训练集中的训练手写中文图像进行顺序标注,并将标注好的训练手写中文图像输入到卷积神经网络‑长短时记忆神经网络中进行训练,采用时序分类算法对卷积神经网络‑长短时记忆神经网络的网络参数进行更新,获取原始手写字识别模型;采用测试集中的训练手写中文图像对原始手写字识别模型进行测试,在测试准确率大于预设准确率时,获取目标手写字识别模型。该中文模型训练方法具有训练效率高且识别精度高的优点。
  • 加速基于卷积神经网络的中文手写体识别的方法-201810789695.4
  • 李志远;滕南君;金敏;鲁华祥 - 中国科学院半导体研究所
  • 2018-07-18 - 2018-12-18 - G06K9/68
  • 一种基于卷积神经网络的中文手写体识别的加速方法,包括如下步骤:手写字符图片数据预处理,方便卷积神经网络的分类实现;搭建卷积神经网络结构,在浅层加入第一分类器,中间层加入第二分类器,顶层加入第三分类器;初始化网络参数,固定浅层网络和第一分类器的参数,利用第二分类器的损失函数指导网络训练,更新中间层网络和第二分类器的参数;固定浅层网络、中间层网络、第一分类器和第二分类器的参数,利用第三分类器的损失函数指导网络训练,更新顶层网络和第三分类器的参数;对三个分类器的损失函数进行加权,利用加权后的损失函数微调整个网络和三个分类器的参数;在测试集上对网络的三个分类器进行测试,评估分类器的性能,并且计算三个分类器所需的计算量。
  • 一种识别图像的方法及装置-201510505814.5
  • 王红娟;董毅;李光瑞;王玉奎 - 浪潮金融信息技术有限公司
  • 2015-08-17 - 2018-11-27 - G06K9/68
  • 本发明提供了一种识别图像的方法及装置,包括:S1:获取待识别图像中的几何结构;S2:获取所述待识别图像的每个几何结构的连接轨迹;S3:获取所述待识别图像中每个几何结构的端点;S4:根据当前几何结构的连接轨迹,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构;S5:根据每个几何结构对应的标准结合结构,对所述待识别图像进行识别。本发明提供的一种识别图像的方法及装置,能够提高图像的识别准确率。
  • 字符识别装置和字符识别方法-201510313899.7
  • 堤庸昂;中岛和树 - 株式会社日立信息通信工程
  • 2015-06-09 - 2018-11-16 - G06K9/68
  • 提供高精度且高速地识别包括简体文字和繁体文字的汉字的字符识别装置和字符识别方法。运算部(150)将同形字符表保存在字符辨别用辞典(165)中,参照该同形字符表中保存的候选字符来进行字符识别,其中,该同形字符表是将以下字符图像作为相似度高的同形字符进行分组而得到的:将由多个区域的汉字要素构成的汉字按每个区域进行分割所得到的汉字结构相同、且同一区域位置的汉字要素之间的基于余弦相似度的相似度高于规定值的字符图像;以及汉字要素之间的通过欧几里德距离值计算步骤计算出的欧几里德距离值小于规定值的字符图像。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top