[发明专利]一种基于线性结构提取的自然场景文本检测方法有效

申请号：	201510046301.2	申请日：	2015-01-29
公开（公告）号：	CN104573685B	公开（公告）日：	2017-11-21
发明（设计）人：	邹北骥;吴慧;陈再良;赵于前	申请（专利权）人：	中南大学
主分类号：	G06K9/20	分类号：	G06K9/20;G06K9/34;G06K9/62
代理公司：	长沙市融智专利事务所43114	代理人：	黄美成
地址：	410083 湖南***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于线性结构提取的文本检测方法，将文本连通区域看作是不同形状的线性结构的组合；通过提取线性结构，粗略定位文本区域；然后通过色彩聚类和基于色彩距离的区域生长，从初始文本区域中得到完整的文本连通域。进一步分析连通区域的几何和空间位置特征，得到候选文本字符串。其中，线性结构的提取采用多尺度Hessian矩阵滤波方法，分别对原始彩色图像的R、G和B三个通道上操作，使得本方法在一定程度上，克服光照对图像的影响；通过高斯混合模型色彩聚类和基于色彩距离的区域生长，两步色彩分析方法，使得本方法对不同大小、笔画宽度文本的检测性都较好，进一步提高本方法的鲁棒性。
搜索关键词：	一种基于线性结构提取自然场景文本检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于线性结构提取的自然场景文本检测方法，其特征在于，该方法包括以下步骤：步骤1：获取待进行文本检测的原始图像的R、G、B色彩通道图像；步骤2：分别计算步骤1中获得的R、G、B色彩通道图像中每个像素点的Hessian矩阵，并计算对应Hessian矩阵的两个特征值λ1和λ2，其中，|λ2|≤|λ1|；步骤3：基于每个像素点的Hessian矩阵，提取色彩通道图像中的线性结构；利用高斯核函数按照以下公式依次对R、G、B色彩通道图像中每个像素点的Hessian矩阵进行卷积滤波操作，获得每个色彩通道图像中每个像素点的较亮滤波结果和较暗滤波结果，从而得到每个色彩通道图像的较亮滤波图像和较暗滤波图像并从中提取出文本字符所在区域对应的线性结构；Fδ1(x,y)=0,ifλ2>0e-RB22β2(1-e-S22c2),otherwise]]>Fδ2(x,y)=0,ifλ2<0e-RB22β2(1-e-S22c2),otherwise]]>其中，δ表示高斯核函数中的尺度，δ∈[1,4]；对于每个像素点的Hessian矩阵变换，RB表示特征值比率，RB＝λ1/λ2，S表示特征值模长，c表示每个色彩通道中所有像素点中模长的最大值的二分之一，c＝max(S)/2，β是常量，β∈[0,1]；步骤4：对线性结构进行定位；对每个色彩通道图像的较亮滤波图像和较暗滤波图像按照设定的二值化阈值进行二值化操作，将灰度大于二值化阈值的像素点置为1，灰度小于二值化阈值的像素点置为0，提取文本像素点的位置，对线性结构进行定位，获得每个色彩通道图像对应的两幅线性结构定位图；步骤5：将三个色彩通道图像对应的两幅线性结构定位图分别对应合并，得到两幅线性结构定位合并图；步骤6：提取线性结构定位合并图中的连通域，将连通域合并，获得文本字符串；从两幅线性结构定位合并图中分别提取连通区域，计算每个连通区域的几何和空间位置特征，利用相邻连通区域的高度、笔画宽度、垂直重复率和水平距离在设定范围内的连通区域进行合并，获得文本字符串及其所在图像中的位置；所述连通区域的几何特征包括连通区域的高度、笔画宽度，空间位置特征包括连通域之间的垂直重复率、水平距离；所述步骤6中连通域的合并过程，具体如下：步骤6.1：对待进行字符合并的图像进行连通域搜索，获取每个连通域的最大外接矩形的高度h，并根据所述最大外接矩形几何中心水平坐标位置，按照从左到右、从上到下的顺序，依次采用标签标记连通域；每个连通域的标签即为对应连通域的最大外接矩形几何中心水平坐标，最大外接矩形几何中心水平坐标以图像的左上角为原点；步骤6.2：利用现有的连通域笔画宽度计算方法，计算步骤6.1获得的连通域中每个像素点的笔画宽度，并将每个连通域中所有像素点的笔画宽度的平均值，作为该连通域的笔画宽度sw；步骤6.3：将标签最小的连通域记为cF，并加入文本字符串，标签大于cF的标签的连通域记为候选邻域字符cL，依次将cF和每个cL视为字符对，提取每对字符对的高度比Rh、笔画宽度比Rsw，垂直重复率Rvol和水平距离D，计算公式分别如下：Rh=max(hL,hmean)min(hL,hmean)]]>Rsw=max(swL,swmean)min(swL,swmean)]]>Rvol=vFL(hF+hL)/2]]>D=dFL(hF+hL)/2]]>其中，hL、swL分别表示候选邻域字符cL的高度和笔画宽度；hmean、swmean分别表示字符串中所有字符高度和笔画宽度的平均值；vFL、dFL分别表示字符cF与候选邻域字符cL的外接矩形的垂直重复率和水平距离；hF表示标签最小的连通域cF的高度；步骤6.4：将同时满足Rh≤T1，Rsw≤T2，Rvol≥T3，D≤T4四个条件的所有cL加入文本字符串，其中，T1、T2、T3和T4分别表示字符对高度比、笔画宽度比、垂直重复率和水平距离的阈值，取值范围为T1∈[1,2.5]，T2∈[1,2.5]，T3∈[0.5,1]，T4∈[0,3]；步骤6.5：将新加入的连通区域中标签最大的字符作为新的CF，重复步骤6.4‑6.5找到所有满足条件的连通区域，得到某一完整字符串；步骤6.6：对步骤5得到的两幅线性结构定位合并图，重复步骤6.1‑6.6，找到所有文本字符串，得到最终的文本检测结果；对两幅线性结构定位图进行色彩分析获得更加完整的字符串，具体过程如下：步骤7.1：基于高斯混合模型对两幅线性结构定位图进行色彩聚类，获得色彩层信息，按照色彩层信息，对两幅线性结构定位图中的每个像素点按照色彩层信息获得对应的色彩聚类结果图；步骤7.2：对每幅色彩聚类结果图中的像素点作为初始种子点，采用基于色彩距离的区域生长方法，填充色彩聚类结果图中的离散线性结构，得到每幅色彩聚类结果图中的完整的连通域，用于字符合并；对步骤6获得的文本字符串进行得分计算，保留满足设定条件的文本字符串，作为最终的检测结果；所述步骤5的线性结构定位图的合并规则具体如下：M1′=Ir1∪Ig1,ifsum(Ir1∩Ig1)>sum(Ir1∩Ig2)Ir1∪Ig1,otherwise]]>M1=M1′∪Ib1,ifsum(M1′∩Ib1)>sum(M1′∩Ib2)M1′∪Ib2,otherwise]]>M2′=Ir2∪Ig2,ifsum(Ir2∩Ig2)>sum(Ir2∩Ig1)Ir2∪Ig1,otherwise]]>M2=M2′∪Ib2,ifsum(M2′∩Ib2)>sum(M2′∩Ib1)M2′∪Ib1,otherwise]]>其中，Ir1、Ig1和Ib1分别表示R、G和B色彩通道较亮线性结构定位结果，Ir2、Ig2和Ib2分别表示R、G和B色彩通道较暗线性结构定位结果；M'1和M1分别为以Ir1为初始合并对象得到的中间合并结果和最终合并结果；M'2和M2分别为以Ir2为初始合并对象得到的中间合并结果和最终合并结果；所述步骤7.1的具体步骤如下：使用高斯混合模型，对两幅线性结构结果图中的像素点进行色彩聚类，得到色彩层，进一步包括以下步骤：步骤A1：对线性结构定位图中的像素点，提取其在R、G和B通道上的值作为色彩特征；步骤B1：用K均值方法，根据步骤A1获取的色彩特征，将像素点分成K类，K取值为3～5之间的整数，计算每个类的聚类中心μi和标准差σi，1≤i≤K，利用聚类中心和标准差初始化高斯混合模型P(x|μ,σ)：P(x|μ,σ)=Σi=1KωiPi(x|μi,σi)]]>其中，x表示被分类的像素点，ωi、μi和σi分别表示第i个高斯混合模型的权重、均值和标准差；步骤C1：用最大期望算法，迭代优化高斯混合模型中的参数，直到收敛，计算公式如下：ωit+1=1NΣj=1KPi(xj|μit,σit)]]>μit+1=Σj=1NPi(xj|μit,σit)xjΣj=1NPi(xj|μit,σit)]]>μit+1=Σj=1NPi(xj|μit,σit)(xj-μit+1)2Σj=1NPi(xj|μit,σit)]]>其中，xj表示第j个像素点，和表示第i个高斯模型在第t次迭代步骤下的均值和方差，表示在第t次迭代步骤下，xj像素点在第i个高斯模型下的概率，和表示第t+1次迭代步骤下，第i个高斯模型的权重、均值和方差；N表示线性结构定位图中像素点的个数，t表示第t次迭代步骤；步骤D1：对于某一像素点，将其归类到概率值最大的高斯模型中；对图像中所有像素点分类，得到K个色彩层；对两幅线性结构定位图中的每个像素点按照色彩层信息获得对应的色彩聚类结果图；所述步骤7.2的具体过程如下：步骤A2：将色彩聚类结果图中的像素点，作为初始种子点，加入集合Ci中，将对应色彩中心(μi(r),μi(g),μi(b))，作为初始的色彩中心，其中，i表示第i个色彩层；步骤B2：获取所有初始种子点的8邻域像素点，对于不在集合Ci中的邻域像素点，计算其RGB色彩值(p(r),p(g),p(b))与色彩中心的距离，计算公式如下：Dc=(p(r)-μit(r))2+(p(g)-μit(g))2+(p(b)-μit(b))2]]>其中，t表示第t次迭代，第t次迭代色彩层Ci的色彩中心；步骤C2：将满足条件Dc<48的邻域像素点加入集合Ci，按照下面的公式，更新色彩中心，完成此步区域生长：μit+1(r)=1NΣj=1Nxjr,μit+1(g)=1NΣj=1Nxjg,μit+1(b)=1NΣj=1Nxjb]]>步骤D2：将上步骤中得到区域生长结果图中的像素点，作为新的种子点，重复步骤B2‑C2，直到没有满足条件的像素点加入Ci，得到该色彩层最终的区域生长结果；步骤E2：对于所有色彩聚类结果图，分别进行步骤A2‑D2所述区域生长过程，得到对应图像的区域生长结果图，用于提取字符连通域。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中南大学，未经中南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510046301.2/，转载请声明来源钻瓜专利网。

上一篇：一种基于模糊退化模型的车牌二值化方法
下一篇：一种编码信息扫描方法及装置

同类专利

数据处理方法及相关产品-201910582557.3
发明人：赵伟玉 -专利权人：万翼科技有限公司
申请日： 2019-06-29 - 公布日： 2019-11-12 - 主分类号： G06K9/20
摘要：本申请实施例提供一种数据处理方法及相关产品，其中，所述方法包括：所述服务器接收智能电子笔发送的目标消息，所述目标消息携带标识信息、目标信息和参考位置信息，所述目标信息为目标用户采用所述智能电子笔的书写模块在所述目标纸质图纸上书写的信息；所述服务器根据所述参考位置信息，将所述目标信息设置于参考电子图纸的目标位置，得到目标电子图纸，所述目标位置为与所述参考位置信息指示的位置相对应的位置，所述参考电子图纸为与目标纸质图纸相对应的图纸，所述目标纸质图为所述标识信息指示的图纸。因此，能够提升电子图纸标注时的效率。

一种电能表屏显数据自动识别装置-201920040963.2
发明人：关可飞;夏斌;劳锐俊;区健华;谭迪江 -专利权人：广东电网有限责任公司;广东电网有限责任公司江门供电局
申请日： 2019-01-10 - 公布日： 2019-11-12 - 主分类号： G06K9/20
摘要：本实用新型公开了一种电能表屏显数据自动识别装置，包括ARM核心模块、蓝牙通信模块、USB模块、显示屏、控制面板、数字摄像识别模块和电源模块，其中：所述电源模块分别与ARM核心模块、蓝牙通信模块、USB模块、显示屏、控制面板和数字摄像识别模块电连接；所述ARM核心模块集成有摄像头，所述ARM核心模块分别与所述蓝牙通信模块、USB模块、显示屏、控制面板、数字摄像识别模块电连接。本实用新型对电能表显示屏进行拍摄，利用现有的数字图像识别技术获取屏显数据，实现换表现场快速获取电能表屏显数据并存储，通过蓝牙通信模块进行数据上传。

一种智慧型停车场车牌识别一体设备-201920404010.X
发明人：白冰;徐贵;李成 -专利权人：天津天盛鼎和通信工程有限公司
申请日： 2019-03-28 - 公布日： 2019-11-12 - 主分类号： G06K9/20
摘要：本实用新型涉及停车场技术领域，且公开了一种智慧型停车场车牌识别一体设备，包括支撑底座，所述支撑底座的顶部固定安装有防护壳，且支撑底座顶部的一侧活动套接有螺栓，所述防护壳的顶部固定安装有支撑架，且支撑架内腔的一侧固定安装有转动套，所述转动套的内腔固定安装有连接杆，且连接杆外表面的中部固定安装有识别摄像头，所述防护壳内腔的底部固定安装有中央处理器。该智慧型停车场车牌识别一体设备，通过转动套、连接杆和控制器之间的相互配合，便于更好的转动识别摄像头的角度，从而解决了识别摄像头的角度都是固定不变的进而导致一些车辆在驶入的过程中无法扫描到车牌，提高了车牌识别的准确性。

一种集成多探测器的取像装置-201920441906.5
发明人：邢智林 -专利权人：专知利乎成都知识产权运营有限公司
申请日： 2019-04-03 - 公布日： 2019-11-12 - 主分类号： G06K9/20
摘要：本实用新型公开了一种集成多探测器的取像装置，包括用于保护装置的盖板，所述盖板呈透明状且下部两侧分别设置有光源部分与取像部分，并且所述光源部分与取像部分通过第一红外滤光片相隔离；所述光源部分包含红外光源与两个反射镜，当手指遮住盖板时，所述红外光源发出的光线经过两个反射镜的依次反射，最后在表面发生第三次反射后进入取像部分，所述取像部分即完成取像过程。本实用新型通过将光源部分与取像部分分开设置，调整光线的反射角度，有效控制光线的传播路径，有利于提升光线利用率，便于后期取像，同时调变不同遮光层透光口和多个探测器的尺寸，能够有效解决成相时的串扰。

机动车识别号采集比对装置-201920473950.4
发明人：任石峰 -专利权人：天津智通爱码信息技术股份有限公司
申请日： 2019-04-10 - 公布日： 2019-11-12 - 主分类号： G06K9/20
摘要：机动车识别号采集比对装置。本产品其组成包括:底板，底板顺次连接左封闭板、前封闭板、右封闭板、后封闭板，左封闭板与右封闭板之间连接有一组日光灯管，日光灯管连接电源和开关，开关固定在右封闭板的外侧，左封闭板开有左直角槽，前封闭板开有前直角槽，右封闭板开有右直角槽，后封闭板开有后直角槽，左直角槽、前直角槽、右直角槽、后直角槽之间相通，左直角槽、前直角槽、右直角槽、后直角槽之间装入玻璃板，玻璃板上放置拓号纸和行车证纸，左封闭板开有一组竖向排列的左卡槽，右封闭板开有一组竖向排列的右卡槽，左卡槽与右卡槽之间插入透明立板，透明立板压住拓号纸和行车证纸的顶边和底边。本实用新型用于机动车识别号比对。

一种基于深卷积神经网络的自然场景图像文本检测方法-201910652768.X
发明人：李孝杰;伍贤宇;史沧红;吴锡;何嘉 -专利权人：成都信息工程大学
申请日： 2019-07-19 - 公布日： 2019-11-08 - 主分类号： G06K9/20
摘要：本发明公开了一种基于深卷积神经网络的自然场景图像文本检测方法，该方法具体包括以下步骤：制作数据集，将所有图片按照VOC格式制作成数据集，文件夹Annotation用于存放xml文件，每一个xml文件对应一张图像，并且每个xml文件中存放的是标记的各个目标的位置和类别信息。将自然图像通过ResNet网络从底层像素点获取更多的高级特征，然后利用BLSTM层提取字符序列的上下文特征，找到检测文本的边界框，有效地提高了文本检测的效果。本发明的有益效果：本发明使用自动学习，结合上下文特征替换人工定义的特征；本发明避免字符分割问题，实现端到端的无约束字符检测。提高了检测效率和精度，实现了对自然场景图像的文本检测。

多媒体数据处理方法及装置、电子设备和可读存储介质-201910693768.4
发明人：刘攀;杨瑞光;施佳子;罗涛 -专利权人：中国工商银行股份有限公司
申请日： 2019-07-29 - 公布日： 2019-11-08 - 主分类号： G06K9/20
摘要：本公开提供了一种多媒体数据处理方法，其中，多媒体数据包括音频数据和视频数据，该方法包括：将视频数据包含的多帧图像划分为多个图像组，其中，多个图像组中的每一个图像组包含N帧图像，N为大于等于1的整数；对每一个图像组中的N帧图像进行识别，确定N帧图像中的字幕；获取每一个图像组中的N帧图像中的字幕输出时的起始时刻和结束时刻；根据每一个图像组中的N帧图像中的字幕输出时的起始时刻和结束时刻，对音频数据进行切分，得到多个子音频数据；以及将多个子音频数据中的每个子音频数据与对应的字幕进行关联，生成语料数据。本公开还提供了一种多媒体数据处理装置、一种电子设备和一种计算机可读存储介质。

电子图像的文字的识别方法及图像处理装置-201811210850.9
发明人：聂颖;王竹欣;郑权;张峰 -专利权人：龙马智芯（珠海横琴）科技有限公司
申请日： 2018-10-17 - 公布日： 2019-11-08 - 主分类号： G06K9/20
摘要：本发明公开一种电子图像的文字的识别方法，包括：(1)对具有固定格式的至少一类电子图像下的至少一个样本图像按预设特征点提取灰度序列码，将所述样本图像的灰度序列码存储于一数据库；(2)输入待识别图像，对所述待识别图像按所述预设特征点提取灰度序列码；(3)将所述待识别图像的灰度序列码与所述数据库中存储的灰度序列码进行匹配，匹配度不小于Q则判断所述待识别图像为具有固定格式的电子图像，否则判断所述待识别图像为无固定格式的电子图像。本发明的有益效果在于：对待识别的图像文件的种类进行分类，将有固定格式的电子图像和无格式的电子图像分类处理，节约了文字识别的时间且提高了文字识别的效率。

对象电子化的方法、装置、服务器及存储介质-201910515808.6
发明人：汪祖臣;王佳军;龙力 -专利权人：拉扎斯网络科技（上海）有限公司
申请日： 2019-06-14 - 公布日： 2019-11-05 - 主分类号： G06K9/20
摘要：本发明实施例涉及信息处理技术领域，公开了一种对象电子化的方法、装置、服务器及存储介质。对象电子化的方法，包括：分割目标对象，得到所述目标对象的文本行及所述文本行的位置信息；识别所述文本行，得到所述文本行的内容信息；根据所述文本行的内容信息和所述文本行的位置信息，生成电子化的所述目标对象。采用本发明的实施方式，有效提升了将纸质对象电子化的效率和准确率。

用于OLED屏幕的集成式生物识别器件的光路结构及电子设备-201910689573.2
发明人：杨成龙 -专利权人：上海菲戈恩微电子科技有限公司;成都费恩格尔微电子技术有限公司
申请日： 2019-07-29 - 公布日： 2019-11-05 - 主分类号： G06K9/20
摘要：本发明公开了一种用于OLED屏幕的集成式生物识别器件的光路结构及电子设备，该光路结构包括红外滤光片、低折射率光学填充材料、Microlens阵列、消杂光光阑、视场光阑、光学填充材料及光电感应器。本发明基于芯片上Microlens收集光强的工作方式，通过在Microlens阵列与红外滤光片之间填充低折射率的光学填充材料，减少由红外滤光片与空气、空气与Microlens层的菲涅尔反射损耗，增加光学系统的透光率，从而达到增加光电感应器的感光能力；并通过视场光阑和消杂光光阑结构来调整Microlens的可视视场和防止杂光干扰，实现了超薄间距下的OLED屏下指纹图像采集。

用于LCD屏内指纹识别的背光模组及电子设备-201910717244.4
发明人：张小齐;曾晓虎;彭益;刘政 -专利权人：深圳市隆利科技股份有限公司
申请日： 2019-08-05 - 公布日： 2019-11-05 - 主分类号： G06K9/20
摘要：本发明公开了一种用于LCD屏内指纹识别的背光模组及电子设备。背光模组包括光学膜片组、红外透明遮光层、光源和指纹识别传感器。光学膜片组包括设置在该光源一侧的导光板、设置在该导光板上方的扩散膜，设置在该扩散膜上方的棱镜片，以及设置在该导光板下方的反射片。指纹识别传感器，其设置在该光学膜片组下方。红外透明遮光层，其与该光学膜片组或者光源连接，该光学膜片组在该红外透明遮光层上的垂直投影与该红外透明遮光层具有不重合区域，以使得红外光透过该红外透明遮光层。

一种微米级ID图像识别的系统及用于ID图像识别的装置-201920302205.3
发明人：程木海;马潮;聂嵩 -专利权人：北京壹达创智科技有限公司
申请日： 2019-03-11 - 公布日： 2019-11-05 - 主分类号： G06K9/20
摘要：本实用新型提供一种微米级ID图像识别的系统及用于ID图像识别的装置，其中所述系统包括摄像头、高倍显微镜、上位机，所述摄像头配置为，观察待测物品的整体状况，以确定所述待测物品的数量和位置关系，所述待测物品包括一个或多个；所述高倍显微镜配置为，调整视场并依次识别所述待测物品的ID图像；所述上位机与所述摄像头和所述高倍显微镜分别相连，并配置为，控制所述摄像头和所述高倍显微镜，并依次记录相应的ID信息。根据本实用新型的技术方案，可以代替人工用显微镜肉眼识别和记录芯片ID的工作，实现自动识别和记录，降低了对操作人员的技术要求，也大大提高了识别和记录的准确度，提高了工作效率。

证照仪-201920698115.0
发明人：钟拥军 -专利权人：长沙德强智能科技有限公司
申请日： 2019-05-15 - 公布日： 2019-11-01 - 主分类号： G06K9/20
摘要：本实用新型提供了一种证照仪，包括依次相连的摄像头、处理电路和天线板，处理电路包括处理器和USB集线控制电路，USB集线控制电路包括USB集线控制器、摄像头接头、天线板接头和上位机接头，USB集线控制器与摄像头之间通过摄像头接头相连接；USB集线控制器与天线板之间通过天线板接头相连接；USB集线控制器与上位机之间通过上位机接头相连接；处理器用于控制摄像头采集证件图像信息，并控制将证件图像信息通过天线板无线传输给上位机和/或通过上位机接头传输给上位机。本实用新型提供的证照仪，电路简单、制造成本低；通用性强，装拆方便，可适配和更换不同型号的摄像头、上位机和天线板。

一种融合视觉与文本特征的简历版面分析算法-201910685047.9
发明人：丁伟峰 -专利权人：苏州过来人科技有限公司
申请日： 2019-07-27 - 公布日： 2019-10-29 - 主分类号： G06K9/20
摘要：本发明公开了一种融合视觉与文本特征的简历版面分析算法，该简历版面的分析包括以下步骤：步骤1：从pdf读取程序或ocr引擎中得到文本行及其坐标；步骤2：使用神经网络对第i行的文本进行编码，得到文本嵌入向量text_emb(i)；步骤3：提取对应行的图像，得到图像嵌入向量img_emb(i)；步骤4：提取字号、文字长度特征，并进行归一化得到特征向量；步骤5：聚合步骤2、3、4得到的向量，得到行嵌入line_emb(i)；步骤6：使用神经网络对行向量序列[line_emb(i)]进行序列标注。本发明通过结合简历的视觉特征和文本语义特征，对简历进行语义划分，识别独立的段落单元。

取像装置-201920526854.1
发明人：李文政;王炯翰 -专利权人：金佶科技股份有限公司
申请日： 2019-04-18 - 公布日： 2019-10-29 - 主分类号： G06K9/20
摘要：一种取像装置，其包括盖板、取像模组、框体、第一粘着层以及第二粘着层。框体与取像模组位于盖板的同一侧。框体经由第一粘着层而与盖板接合。取像模组经由第二粘着层而与框体接合。第二粘着层在盖板上的正投影落在框体在盖板上的正投影内。

利用透明根管牙齿模型实训的评价用扫描拍摄装置-201822130769.1
发明人：孙皓;吴雷;秦晓峰 -专利权人：日进教学器材（昆山）有限公司
申请日： 2018-12-19 - 公布日： 2019-10-25 - 主分类号： G06K9/20
摘要：本实用新型公开了一种利用透明根管牙齿模型实训的评价用扫描拍摄装置，通过驱动电机带动安装于牙齿夹具上的透明根管牙齿模型连续匀速运转，再通过线阵相机组件扫描拍摄透明根管牙齿模型的周侧面的图像，可以获得牙齿模型根管的侧面一周的图像数据，通过面阵相机组件拍摄透明根管牙齿模型顶部的根管髓室顶的图像，可以获得根管的髓室图像数据，这样，通过两幅图像数据，就可以完整获得根管治疗评价所需的整颗牙齿模型中的根管的形状数据，大大降低了后续的软件图像分析工作量和计算时间。因此，本实用新型能够用于口腔教学中对根管治疗结果进行日常的客观评价，且使用便捷、外观小巧、经济上可被普遍承受。

一种文字识别方法、装置及设备-201910681467.X
发明人：张瀚文;张宏韬;李兆佳;曲建方 -专利权人：中国工商银行股份有限公司
申请日： 2019-07-26 - 公布日： 2019-10-22 - 主分类号： G06K9/20
摘要：本说明书实施例提供一种文字识别方法、装置及设备。所述方法包括：接收待识别图像；根据所述待识别图像中像素对应的特征值，获取文本区域子图像；将所述文本区域子图像输入文字识别模型，得到对应于所述文本区域子图像的识别文字数据；所述文字识别模型，包括基于被批注的图像数据样本训练出的机器学习模型；整合所述识别文字数据并反馈。通过上述方法，提高了图像中文字识别的准确性，简化了文字识别的步骤，从而能够快捷准确地实现文字识别。

钟鼎碑刻拓印方法-201510846592.3
发明人：刘清珺 -专利权人：北京市计算中心
申请日： 2015-11-26 - 公布日： 2019-10-22 - 主分类号： G06K9/20
摘要：本发明公开了一种钟鼎碑刻拓印方法，所述方法包括以下步骤：S1导入对文字进行三维扫描得到的三维点云数据；S2对所述三维点云数据进行底面消除，并且将底面消除后得到的数据转换为带深度信息的二维矩阵中，之后对二维矩阵中的数据进行优化处理；S3对所述步骤S2处理后的数据进行显示设置；S4将所述步骤S3处理后的数据进行文字分割和文字编辑。本发明提出的技术解决方案适应无论是钟鼎文(阳文)，还是碑刻文(阴文)的文字提取工作，并且可以可达到非常好的文字提取效果。同时一张文字图像的处理时间只有短短几分钟，使用户告别了繁琐的手工劳动，大大节省了工作时间，并且不会对石碑等文物造成损伤。

一种图像识别扫描设备用图片安放装置-201920628140.1
发明人：熊蕾 -专利权人：江西科技学院
申请日： 2019-05-05 - 公布日： 2019-10-22 - 主分类号： G06K9/20
摘要：本实用新型公开了一种图像识别扫描设备用图片安放装置，包括底座，所述底座的上端固定安装有支撑柱，所述支撑柱的上端固定连接有横梁，所述横梁上开设有条形孔，所述条形孔的内部滑动安装有滚轴，所述底座上开设有第一凹槽，所述滚柱的下端位于第一凹槽内部底端，所述第一凹槽的侧壁上开设有第二凹槽，所述第二凹槽的内部固定安装有弹簧柱，所述弹簧柱的下端固定连接有压板，所述压板的上端中心固定连接有立柱。本实用新型通过安装有支撑柱、横梁、滚轴和滚轮，以及在滚轮的表面固定粘贴有硅胶层，在图片扫描之前能通过转动滚柱对图片的表面进行清理，避免了由于图片上有杂物而造成的图片识别错误。

光学识别模块-201810767443.1
发明人：王佳祥;李俊佑;傅旭文;印秉宏 -专利权人：印芯科技股份有限公司
申请日： 2018-07-13 - 公布日： 2019-10-18 - 主分类号： G06K9/20
摘要：本发明提供一种光学识别模块，其包括盖板、传感器、显示面板、第一偏光片以及第二偏光片。显示面板设置在盖板与传感器之间。第一偏光片设置在盖板与显示面板之间。第一偏光片为圆偏振片或线偏振片。第二偏光片设置在显示面板与传感器之间。第二偏光片为圆偏振片或线偏振片。

试卷答题区域识别及试题评阅方法、系统-201611026941.8
发明人：李康;袁野;单江涛;郑志强 -专利权人：广东墨痕教育科技有限公司
申请日： 2016-11-16 - 公布日： 2019-10-18 - 主分类号： G06K9/20
摘要：本发明属于移动互联网技术领域，提供了一种试卷答题区域识别及试题评阅方法、系统，该方法包括获取m份答题笔迹信息，根据每份答题笔迹信息中笔迹的间隔距离，依次划分答题区域，形成试题数量集合C和答题区域集合R，以确定试题数量n和有效答题区域的个数，将每份答题笔迹信息的每个有效答题区域进行信息识别与统计，确定试题答案，根据每个试题答案对每份答题笔迹信息的每个有效答题区域进行评阅，并获取每份答题笔迹信息的试题评阅结果。本发明试卷答题区域识别及试题评阅方法、系统，能够自动精准地识别试卷答题区域，确定试题数量，并评阅试卷客观题，节省时间，提高效率。

蓝色车牌颜色的识别方法及装置-201610207212.6
发明人：陈晓雷 -专利权人：浙江宇视科技有限公司
申请日： 2016-04-05 - 公布日： 2019-10-18 - 主分类号： G06K9/20
摘要：本申请公开了一种蓝色车牌颜色的识别方法及装置，所述方法包括：当光照亮度低于指定亮度时，开启补光源；所述补光源包括近红外补光光源以及红外补光光源；切换所述摄像机的红外线双滤镜IR‑cut的工作模式，以使可见光和红外光同时通过；近红外补光光源和红外补光光源同时开启识别图像中有蓝色车牌的车辆的车牌颜色。本公开可以通过对图像帧的处理识别出蓝色车牌的颜色，从而解决相关技术中使用红外补光灯时无法识别蓝色车牌颜色的问题。

一种基于深度学习的表计自动识别系统-201910469824.6
发明人：虞明智;杨怀仁;崔建业;赵寿生;李一鸣;周立辉;潘科;李策策;钱平;张永;张良;梁勋萍;商冰煜;项元杰 -专利权人：国网浙江省电力有限公司金华供电公司;国网浙江省电力有限公司
申请日： 2019-05-31 - 公布日： 2019-10-15 - 主分类号： G06K9/20
摘要：本发明涉及一种基于深度学习的表计自动识别系统。解决人工查看表计，无法达到无人巡视效果的问题。系统包括摄像模块、处理端，摄像模块与处理端相连接，摄像模块设置在滑动模块上，系统还包括对滑动模块进行控制的操控端，操控端与滑动模块相连。本发明能够通过图像来识别变电站内表计的读数，达到无人巡视的目的，同时可以进行位置调节，能够采用一个摄像模块对变电站内多个表计读数进行识别，操控简单，同时节约了成本。

字符识别方法及装置-201610581525.8
发明人：陈志军;秦秋平;张旭华 -专利权人：北京小米移动软件有限公司
申请日： 2016-07-21 - 公布日： 2019-10-15 - 主分类号： G06K9/20
摘要：本公开是关于一种字符识别方法及装置。该方法包括：获取包含待识别字符的图像；基于样本权重确定所述图像中的字符区域；对于字符区域进行字符切割；识别切割得到的单个字符。该技术方案在确定字符区域时考虑每个样本的权重值，能够摒弃一些噪声区域或者不完整字符区域的边缘点，更为精确的得到字符区域的上下边界线，进而得到准确的字符区域，最终能够有效提高字符识别的准确率。

一种近红外人脸识别装置-201821544494.X
发明人：周小兵;陈敏;王建帮;邹静;邹建康 -专利权人：苏州新海宜电子技术有限公司
申请日： 2018-09-20 - 公布日： 2019-10-15 - 主分类号： G06K9/20
摘要：本实用新型公开了一种近红外人脸识别装置，包括底座、横板和移动滑板；本实用新型在结构上设计合理，实用性很高，工作时，第一电机通过第一主动皮带轮带动第一从动皮带轮和丝杆旋转，从而通过滑套带动横板进行上下移动，第二电机通过第二主动皮带轮带动主动辊轮和传送带旋转，从而通过固定夹具带动移动滑板沿着横板左右移动，由此使得摄像头可以精确的对准人员的面部，避免了因身高差异导致信息采集失败，使得信息采集精准，且效率高，在电子秤和刻度尺的作用下，可额外采集人体的体重和身高信息，显示屏方便身份信息的展示，通过警报灯和扬声器方便进行声光报警，有效提升安防的等级，及时给安保人员发出警告。

识别包含身份证明证件的图像的系统和方法-201811366446.0
发明人：亚历山大·V·沙罗夫;德米特里·S·多洛戈伊;伊利亚·A·捷列先科 -专利权人：卡巴斯基实验室股份制公司
申请日： 2018-11-16 - 公布日： 2019-10-11 - 主分类号： G06K9/20
摘要：本发明涉及识别包含个人身份证明证件的图像的系统和方法。在一个方面，示例性方法包括：通过从任意序列的图像流中选择图像来获取第一图像集合；确定所述第一图像集合中的包含证件的图像；通过从所述第一图像集合中排除不包含证件的图像，生成第二图像集合；确定所述第二图像集合中的包含身份证明证件的基本结构要素的图像，通过从所述第二图像集合中排除不包含身份证明证件的基本结构要素的图像，生成第三图像集合；以及基于确定规则从生成的所述第三图像集合中识别包含至少一个身份证明证件的至少一个图像。

一种学习资源获取方法、装置、学习终端和存储介质-201910487161.0
发明人：许宋学 -专利权人：广州视源电子科技股份有限公司;广州视睿电子科技有限公司
申请日： 2019-06-05 - 公布日： 2019-10-11 - 主分类号： G06K9/20
摘要：本发明公开了一种学习资源获取方法、装置、学习终端和计算机可读存储介质，方法包括接收当前连接的教师终端发送的课件；显示所述课件，并接收用户在所述课件上的批注；获取所述课件上与所述批注对应的课件内容；识别所述课件内容，并根据识别结果获取与所述课件内容相对应的学习资源；显示所述学习资源。本发明能够根据批注的课件内容获取相对应的学习资源，以使得用户可根据所述学习资源以巩固学习过程中不清楚的知识点并深入学习，提高了用户自主学习能力。

验证码识别方法及装置、可读存储介质-201910517600.8
发明人：陈逸飞;温舒;宗博文;解宇涵;胡宏辉 -专利权人：上海上湖信息技术有限公司
申请日： 2019-06-14 - 公布日： 2019-10-11 - 主分类号： G06K9/20
摘要：一种验证码识别方法及装置、可读存储介质，所述验证码识别方法包括：对待识别图像进行预处理，得到处理后的图像；将所述处理后的图像输入CTC识别模型，得到所述待识别图像所包含的字符；所述CTC识别模型的输出层为Softmax层；去除所述字符中的空字符，得到所述待识别图像中的验证码。采用上述方案，可以有效识别不定长字符图像的验证码。

一种基于机器视觉的票据图像自动获取设备-201920515150.4
发明人：王兴东;张金涛;孔建益;陈和平;邹光明;刘源泂;周晟 -专利权人：武汉科技大学
申请日： 2019-04-16 - 公布日： 2019-10-11 - 主分类号： G06K9/20
摘要：本实用新型公开了一种基于机器视觉的票据图像自动获取设备，所述获取设备由固定基座、十字滑台、吸取设备、环形光源、相机、票盒、背光源和计算机控制器组成；针对不同票据类型的不同尺寸，调节吸盘工作的数量，通过十字滑台和减速电机能随时调整吸盘的位置，使吸盘与票据位置吻合，便于吸盘工作；采用正面照射和背面透射，能很好的解决发票校验码被印章覆盖的问题。

一种物流管理用自带打印功能的单号扫描录取装置-201920468166.4
发明人：徐艳红;吴晶晶 -专利权人：池州职业技术学院
申请日： 2019-04-02 - 公布日： 2019-10-08 - 主分类号： G06K9/20
摘要：本实用新型提供一种物流管理用自带打印功能的单号扫描录取装置，包括受力板，嵌入件，固定件，安装件，连接件，卡板，夹紧件和接触件；所述连接件的左端通过固定连接的方式安装有插入板，且卡板的内端通过弹簧与连接件的内部相连接，且夹紧件的后端通过粘接的方式安装有橡胶材质的防滑件，并且接触件嵌入安装在连接件的内部，再者接触件的两侧与夹紧件以及防滑件的内端相连接，此处的嵌入件是用来带动滚件与主体的内部进行连接的，使嵌入件可以带动滚件进行快速便捷的拆卸，使得滚件可以沾染墨水过涂改水，在将快递单使用或扫描完毕之后，可以直接通过滚件对快递单进行涂改，从而保证隐私，防止重要信息泄露。

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于线性结构提取的自然场景文本检测方法有效

专利文献下载