[发明专利]一种获取异常文字识别区域的方法、电子设备及存储介质有效

申请号：	202210984470.0	申请日：	2022-08-17
公开（公告）号：	CN115205861B	公开（公告）日：	2023-03-31
发明（设计）人：	石江枫;于伟;靳雯;赵洲洋;王全修;吴凡	申请（专利权）人：	北京睿企信息科技有限公司;日照睿安信息科技有限公司
主分类号：	G06V30/146	分类号：	G06V30/146;G06V10/82;G06V30/16
代理公司：	北京锺维联合知识产权代理有限公司 11579	代理人：	安娜
地址：	100013 北京市东***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种获取异常文字识别区域的方法，所述方法包括如下步骤：对中间图像进行识别，当第r个文本识别区域不呈矩形时，获取第r个文本识别区域对应的第一文本识别结果列表，基于映射比例，获取第二文本识别结果列表，将第r个文本识别区域进行等比划分，获取第三文本识别结果列表，基于第一文本识别列表、第二文本识别列表和第三文本识别列表，获取第k识别区域；基于第k识别区域，获取第一增高识别区域；从而获取第σ增高区域，获取第σ增高区域对应的单字文本识别区域作为最终识别区域。本发明对文字进行逐个检测，提高了单个文字的检测精度。
搜索关键词：	一种获取异常文字识别区域方法电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京睿企信息科技有限公司;日照睿安信息科技有限公司，未经北京睿企信息科技有限公司;日照睿安信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202210984470.0/，转载请声明来源钻瓜专利网。

上一篇：一种新型置物装置
下一篇：遥感数据获取方法、装置、电子设备和计算机可读介质

同类专利

一种基于阅卷系统的单页扫描空白页处理系统及方法-202310874576.X
发明人：陈炳洁;王余;杨康;蔡伟谦 -专利权人：珠海读书郎软件科技有限公司
申请日： 2023-07-17 - 公布日： 2023-10-27 - 主分类号： G06V30/146
摘要：本发明公开了一种基于阅卷系统的单页扫描空白页处理系统及方法，系统包括：考务信息模块：用于存储应该参加考试的学生信息以及各个学校预先上传的缺考的学生信息；图像采集模块：用于采集卷面图像；空白页检测模块：用于检测采集的卷面图像是否存在空白页；记录模块：用于当空白页检测模块检测到空白页时，记录所述空白页相关数据；校验模块：用于按如下过程校验检测到的空白页中是否存在有反置页的可能，所述反置页即为由于错误反置试卷或答题卡得到的卷面图像。本发明自动识别出卷面图像中的空白页，并判断是否存在反置页，当发现有反置页风险时工作人员再去查找核实，并且可以高效定位空白页的位置，因此可以大大减少工作人员的工作量。

一种基于机器视觉的指针式压力表自动校验仪示值读数方法-202310934785.9
发明人：刘琦;才滢;白旭;高川;曹向宇;刘天宇;张宏宇 -专利权人：中国人民解放军92493部队计量测试研究所
申请日： 2023-07-27 - 公布日： 2023-10-27 - 主分类号： G06V30/146
摘要：本发明公开了一种基于机器视觉的指针式压力表自动校验仪示值读数方法，包括以下步骤：通过机载相机对仪表进行图像采集和位置标定；对采集到的仪表图像进行倾斜校正；基于标定模板，对仪表表盘的刻度线识别，并基于最大和最小刻度线位置完成刻度线斜率计算；对表盘图像进行预处理及连通区域筛选，初步得到指针在仪表表盘中的大致区域。本发明通过canny算子边缘检测进行轮廓特征提取，进一步提取角点后，将待校正仪表图像和模板仪表图像进行css角点匹配，使用surf算法来确定匹配度，并利用ransac算法去除错误，最后得到投射变换矩阵，从而实现了对倾斜状态的仪表表盘的指针校正的效果，减小了读数受到观测角度影响而产生误差的问题。

一种实时场景文本检测方法-202310493733.2
发明人：宋婉钰;周近;倪艺洋;刘娅璇;朱辉生 -专利权人：江苏第二师范学院
申请日： 2023-04-26 - 公布日： 2023-10-27 - 主分类号： G06V30/146
摘要：本发明公开了一种实时场景文本检测方法，包括获取文本检测训练数据集；建立实时场景文本检测初步模型，主要结构是轻量级特征提取模块、非对称卷积和空洞卷积结合的特征金字塔增强模块和像素聚合后处理模块；根据当前迭代次数与总迭代次数计算标签收缩率，生成动态文本标签；使用动态文本标签对实时场景文本检测初步模型进行训练，并根据损失函数计算损失值，调整初步模型的参数得到实时场景文本检测模型；使用训练得到的实时场景文本检测模型对图像中的文本进行检测。本发明在特征增强模块增加了非对称卷积和空洞卷积操作，在模型训练中采用动态标签使模型经历从易到难的训练过程，提高模型在复杂背景下的检测能力，高效地检测出任意形状文本。

一种文字识别方法及装置-202310642042.4
发明人：蔡君;唐亮;杨件;王靖聪 -专利权人：广东南方网络信息科技有限公司
申请日： 2023-05-31 - 公布日： 2023-10-27 - 主分类号： G06V30/146
摘要：本发明公开了一种文字识别方法及装置，包括：将待检测图片输入预先训练好的第一检测模型，以使所述第一检测模型识别待检测图片中的文字；其中，所述第一检测模型识别待检测图片中的文字，具体为：根据第一生成网络对所述待检测图片进行特征提取操作，获得各卷积层提取的特征样本；并对各卷积层提取的特征样本进行融合操作，获得第一特征，并根据所述第一特征生成文本候选框；所述融合操作包括求和操作和拼接操作；根据纵横向预测序列定位所述文本候选框中的曲线文本，并根据多边形处理模型检测所述文本候选框中的重叠框，生成单词级边界框，以识别待检测图片中的文字。

图片矫正方法、装置、电子设备及计算机可读存储介质-202110477871.2
发明人：韩光耀;姜泽青;陈禹燊;李治平 -专利权人：北京百度网讯科技有限公司
申请日： 2021-04-29 - 公布日： 2023-10-24 - 主分类号： G06V30/146
摘要：本公开提供了图片矫正方法、装置、电子设备及计算机可读存储介质，涉及自然语言处理、深度学习及计算机视觉等人工智能领域，其中的方法可包括：对待处理的原始图片进行文字检测，得到检测出的文字框；根据文字框生成文本行；确定出文本行中的关键点，并根据关键点对预定参数进行更新；根据更新后的预定参数对原始图片进行重映射，得到矫正后的图片。本公开所述方案具有普遍适用性，并确保了处理结果的准确性。

一种基于动态分层嵌套残差网络的文字方向识别方法-202211569791.0
发明人：牛太阳;张健;王佩雅 -专利权人：中化现代农业有限公司
申请日： 2022-12-08 - 公布日： 2023-10-20 - 主分类号： G06V30/146
摘要：本发明提供了一种基于动态分层嵌套残差网络的文字方向识别方法，包括以下步骤：训练基于卷积神经网络的神经网络模型Res2Net‑I；获取文字图像，输入至神经网络模型Res2Net‑I中，进行文字方向识别；所述神经网络模型Res2Net‑I训练时，包括以下步骤：获取文字图像，对图像随机截取5份；对截取的部分按顺时针0,90,180,270四个方向随机旋转保存；对保存图像按文字的顺时针0,90,180,270四个方向进行分类；本发明以实际业务场景出发，通过深度学习的方式，训练收集的文字图像数据，得到文字方向，首先对所收集的图片随机截取5份，并将截取部分按顺时针0,90,180,270四个方向随机旋转，然后将其按文字方向进行分类，既能够提高正确率，又能够提高效率。

图像处理方法、相关装置及计算机程序产品-202110576183.1
发明人：谢群义;钦夏孟;章成全;姚锟 -专利权人：北京百度网讯科技有限公司
申请日： 2021-05-26 - 公布日： 2023-10-20 - 主分类号： G06V30/146
摘要：本公开提供了图像处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品，涉及计算机视觉和深度学习等人工智能技术领域，可应用于图像识别场景下。该方法的一具体实施方式包括：确定待处理图像在不同分辨率下构成待矫正对象的像素点的三维坐标，得到三维预测坐标后，根据该三维预测坐标确定该待矫正对象的表面扭曲参数，最终根据该三维预测坐标和该表面扭曲参数生成该待矫正对象的平面图像。该实施方式基于不同分辨率的待处理图像进行三维坐标预测，以更精准的确定待矫正对象的表面扭曲参数，实现更为精准的图像扭曲矫正，提升图像识别、矫正结果的质量。

一种铸坯字符的检测与识别方法、装置、设备及存储介质-202310593815.4
发明人：殷绪成;胡中杰;陈松路;刘琦;陈峰 -专利权人：珠海亿智电子科技有限公司
申请日： 2023-05-25 - 公布日： 2023-10-17 - 主分类号： G06V30/146
摘要：本发明适用人工智能与计算机视觉领域，提供了一种铸坯字符的检测与识别方法、装置、设备及存储介质，该方法包括：当接收到铸坯字符识别请求时，获取待识别的铸坯图像，通过预先训练好的铸坯字符检测识别网络对铸坯图像进行处理，得到铸坯图像的矫正字符信息，其中，铸坯字符检测识别网络包括第一网络和第二网络，根据矫正字符信息和预设的矫正算法得到铸坯图像中的铸坯字符，从而有效降低了漏识和错识的概率，提高了任意方向且多行分布的铸坯字符的检测和识别性能，同时有效提高了识别准确度。

一种目标码定位方法、装置、电子设备及存储介质-202010517844.9
发明人：张发恩;杨帅 -专利权人：创新奇智（合肥）科技有限公司
申请日： 2020-06-09 - 公布日： 2023-10-13 - 主分类号： G06V30/146
摘要：本申请涉及一种目标码定位方法、装置、电子设备及存储介质，属于人工智能技术领域。该方法包括：获取包含目标码的原始图像；将所述原始图像输入到预先训练好的基于深度学习的特征提取网络，输出所述目标码的坐标位置，所述坐标位置包括所述目标码所在区域的中心点横坐标、中心点纵坐标、宽、高以及旋转角度。该方法将旋转角度纳入目标码的坐标位置中，使得在进行目标码定位时，可以直接利用包含目标码的原始图像作为输入，快速定位图像中目标码的位置，输出目标码所在区域的中心点横坐标、中心点纵坐标、宽、高以及旋转角度，而无需进行去噪等预处理和角度判断、旋转等后处理，具备准确度高、实时性好的特点。

边框检测方法、装置及存储介质-201710882948.8
发明人：孙星;王睿;郭晓威 -专利权人：腾讯科技（上海）有限公司
申请日： 2017-09-26 - 公布日： 2023-10-13 - 主分类号： G06V30/146
摘要：本发明公开了一种边框检测方法、装置及存储介质，属于图像处理技术领域。所述方法包括：检测待检测图片中的第一直线段，待检测图片包括目标区域；根据第一直线段，生成目标区域的第一候选边框；从第一候选边框中，获取目标区域的第二候选边框；提取第二候选边框的边框特征；根据第二候选边框的边框特征和预先建立的边框检测模型，从第二候选边框中，获取目标区域的实际边框。本发明通过对待检测图片进行检测，生成第一候选边框，并从第一候选边框中筛选出第二候选边框，进而根据第二候选边框的边框特征和边框检测模型，获取到目标区域的实际边框。该方法并不依赖于选取规则，而是基于边框特征和边框检测模型进行检测，因而检测结果更加准确。

目标区域识别模型训练方法、装置和计算机可读存储介质-201910492786.6
发明人：卢永晨 -专利权人：北京字节跳动网络技术有限公司
申请日： 2019-06-06 - 公布日： 2023-10-10 - 主分类号： G06V30/146
摘要：本公开一种目标区域识别模型训练方法、装置、电子设备和计算机可读存储介质。其中方法包括：获取训练样本集合；将训练样本集合输入卷积神经网络；卷积神经网络包含多个并行的训练通道；每个训练通道根据训练样本集合独立训练直至满足各自的收敛条件，得到包含多个训练通道的目标区域识别模型；其中，所述目标区域识别模型的多个训练通道分别用于预测与所述目标区域相关联的多个特征数据。本公开实施例通过并行的多个训练通道分别对训练样本集合进行训练，使得训练得到的目标区域识别模型包含多个训练通道，并且多个训练通道分别用于预测与所述目标区域相关联的多个特征数据，可以得到更多与目标区域相关的特征，能够提高目标区域确定准确率。

确定文本的方法、深度学习模型的训练方法和装置-202310796813.5
发明人：李泊翰;吴亮;吕鹏原;章成全;姚锟 -专利权人：北京百度网讯科技有限公司
申请日： 2023-06-30 - 公布日： 2023-10-03 - 主分类号： G06V30/146
摘要：本公开提供了一种确定文本的方法，涉及人工智能技术领域，尤其涉及计算机视觉、图像处理、深度学习等技术领域。具体实现方案为：从目标文档图像中确定包含文本段的至少一个图像块；响应于接收输入文本，计算输入文本与每个图像块之间的相似度；以及根据相似度，从至少一个图像块中确定目标图像块包含的文本段为与输入文本对应的目标文本。本公开还提供了一种深度学习模型的训练方法、装置、电子设备和存储介质。

一种购物小票识别方法及系统-202310441477.2
发明人：刘振国;赵润泽;高涛 -专利权人：上海谦贸信息科技有限公司
申请日： 2023-04-23 - 公布日： 2023-10-03 - 主分类号： G06V30/146
摘要：本发明公开了一种购物小票识别方法及系统，包括以下步骤：A、图片处理；B、图片布局分析；C、模板对比：将步骤B中得到的图片b与模板进行布局对比，如无相同布局的模板则将步骤B中得到的图片b制作成模板，人工框定图片b上的矩形区域为模板，并指定数据采集区，对数据采集区的数据进行采集，保存关键字域以及关键字域与数值域之间的向量差；如有相同布局的模板则按照模板指定的数据采集区采集数据，具体分为两步：第一步、通过OpenCV的相关性算法找到关键字域；第二步根据关键字域和数值域的向量差，计算出小票的数值域；D、将步骤C中采集的像素数据转化为文字并存入数据库。

一种智能化记录方法及系统-202310637215.3
发明人：李嘉诚;李孝梁 -专利权人：河南工业和信息化职业学院
申请日： 2023-05-31 - 公布日： 2023-09-29 - 主分类号： G06V30/146
摘要：本申请公开了一种智能化记录方法及系统，用于提高学生的题目温习效果。本申请方法包括：通过摄像设备采集目标习题的题目图像，并获取所述题目图像中的题目信息；根据所述题目信息判断题目数据库中是否存在与所述目标习题一致的标准习题；若存在，则确定所述标准习题的标准习题答案，并根据所述题目信息和所述标准习题答案确定所述目标习题的记录题目类型，所述记录题目类型包括错题类型和非错题类型；将所述记录题目类型、所述标准习题和所述题目图像进行关联绑定，并将所述标准习题和所述题目图像存储至所述记录题目类型对应的题目推荐题库中，以使得学生通过所述题目推荐题库获取所述标准习题和所述题目图像。

水印处理方法及装置-202311000919.6
发明人：张骞;梁冬雨;王冠;刘文杰;卢丹;王珂;崔颖 -专利权人：北京友坤科技有限责任公司;中国信息通信研究院
申请日： 2023-08-09 - 公布日： 2023-09-29 - 主分类号： G06V30/146
摘要：本申请公开了一种水印处理方法及装置，所述方法包括：获得多个背景图像；任意两个所述背景图像之间在至少一项图像参数上的参数值不同；根据所述图像参数，对初始水印图像进行处理，以得到样本水印图像；任意两个所述样本水印图像之间在至少一项水印参数上的参数值不同；将所述样本水印图像添加到所述背景图像，以得到样本图像；使用所述样本图像和所述样本水印图像，对水印检测模型进行训练，以使得所述水印检测模型能够检测目标图像中的水印区域。

一种文字倾斜矫正方法及电子设备-201910592050.6
发明人：周林 -专利权人：广东小天才科技有限公司
申请日： 2019-07-02 - 公布日： 2023-09-26 - 主分类号： G06V30/146
摘要：本发明实施例涉及教育技术领域，公开了一种文字倾斜矫正方法及电子设备，该方法包括：当进入听写模式时，通过拍摄装置在拍摄装置拍摄到的书写页面上投影标准线；检测并记录书写页面上的书写文字对应的倾斜度；其中，倾斜度为在书写文字被书写时参考边界线相对于标准线的倾斜角，参考边界线为书写页面的任一边界线；基于书写文字对应的倾斜度，对书写文字进行倾斜矫正，以获得矫正后的目标文字。实施本发明实施例，能够提高文字识别的准确度。

基于集成式深度学习的轮胎压印字符识别通用方法-202211046142.2
发明人：高康;张皓炜;李瑆泽;杨震;吴刚 -专利权人：东南大学
申请日： 2022-08-30 - 公布日： 2023-09-22 - 主分类号： G06V30/146
摘要：本发明公开了基于集成式深度学习的轮胎压印字符识别通用算法，包括步骤为：利用高帧率相机捕捉来往车辆图像；利用YOLO‑V5网络识别图像中的轮胎并定位，通过相机自动对焦与放大重新拍摄被定位轮胎的完整清晰图像；PSENet网络能实现多形态、弯曲以及倒置字符的识别定位；字符正位旋转；采用CRNN网络和BLSTM网络相结合的方法，对矩形字符中的每个标识符均进行识别。本系统能对车辆移动字符方向旋转和夜间行驶光线昏暗的条件下的短时间内定位出轮胎侧壁压印字符的位置，并进行文本识别，可用于收费站与单车道两侧对轮胎型号的快速拍照识别，从而进行进一步处理，如变形检测、超重检测等；其成本小、精度高、速度快、自动化程度高。

内容识别方法、装置、电子设备及可存储介质-202310753300.6
发明人：侯一泽 -专利权人：西安闻泰信息技术有限公司
申请日： 2023-06-25 - 公布日： 2023-09-19 - 主分类号： G06V30/146
摘要：本申请实施例公开一种内容识别方法、装置、电子设备及可存储介质，该方法包括：从初始图像中，提取包含若干个目标字符的区域图像，初始图像包含有手写的字符内容；对区域图像进行连通域分析，得到目标字符对应的一个或多个连通图像块；根据一个或多个连通图像块确定字符搜索区域；基于训练后的字符识别模型，对字符搜索区域进行字符识别，以得到初始图像对应的识别结果；其中，训练后的字符识别模型是根据若干包含手写字符的样本图像进行训练得到的。实施本申请实施例，能够对初始图像中的字符内容进行准确的分割和定位，并减少了表格区域对于位于其中的内容的识别干扰，降低了目标字符的识别难度，提高了内容识别的准确性。

卡证图像识别方法、装置、设备和介质-202310701075.1
发明人：杨兵 -专利权人：北京五八信息技术有限公司
申请日： 2023-06-13 - 公布日： 2023-09-19 - 主分类号： G06V30/146
摘要：本发明公开了一种卡证图像识别方法、装置、设备和介质，涉及目标检测技术领域。该方法包括：获取卡证源图像；对卡证源图像中的卡证进行标注，确定定位卡证的检测框，并基于检测框获取卡证源图像对应的标签信息，标签信息至少包括卡证类别、检测框中心点的横坐标和纵坐标、检测框的长边和短边，检测框的旋转角度；利用卡证源图像及标签信息，训练得到卡证检测模型；基于卡证检测模型对待识别图像进行检测，确定待识别图像上是否存在卡证图像，以及在待识别图像上存在卡证图像的情况下，从待识别图像上分离出卡证图像。该方法通过将定位卡证图像的检测框由水平框转化为旋转框能够准确区分卡证图像与背景图像，从而准确地分离出卡证图像。

文本识别方法、装置、设备和介质-202310700891.0
发明人：杨兵 -专利权人：北京城市网邻信息技术有限公司
申请日： 2023-06-13 - 公布日： 2023-09-19 - 主分类号： G06V30/146
摘要：本发明公开了一种文本识别方法、装置、设备和介质，涉及目标识别技术领域。该方法包括：利用文本定位模型对原始图像中的文本进行定位，确定原始图像中定位文本的文本框；基于位置扰动策略，对文本框进行放大或缩小；基于放大或缩小后的文本框对原始图像进行裁剪，得到多个子图像；基于子图像，训练得到文本识别模型；基于文本定位模型确定待识别图像中的文本框，基于文本框对待识别图像进行裁剪，获得待识别子图像；基于文本识别模型对待识别子图像进行识别，确定待识别子图像中的文本。该方法能够在不改变待识别图像中真实文本像素分布的情况下，平衡文本定位模型输出的无效文本像素的位置敏感性，提高识别模型关于位置的泛化能力和准确率。

多通道集装箱号识别方法、装置和系统-201811632508.8
发明人：刘永春;姚彦洁;张䶮;王志明;李苇 -专利权人：同方威视技术股份有限公司
申请日： 2018-12-28 - 公布日： 2023-09-15 - 主分类号： G06V30/146
摘要：本公开的实施例公开了一种多通道集装箱号识别方法，包括：通过多个通道中的每一个通道向集装箱号检测模型输入待识别箱号图像，以生成与多个建议框相关的信息，所述信息包括所述建议框的位置和所述建议框包含相应字符的概率；对与每个通道相对应的多个建议框进行箱号字符提取，以获得与每个通道相对应的通道识别结果；以及利用最大概率和法分别计算与所述多个通道相对应的多个通道识别结果的概率和，以选择与概率和最大的通道相对应的通道识别结果作为集装箱号识别结果。

一种基于多尺度卷积的极端长宽比文本检测方法及系统-202310602417.4
发明人：李慧;方徐伟;徐小龙;周松 -专利权人：天翼电子商务有限公司
申请日： 2023-05-25 - 公布日： 2023-09-12 - 主分类号： G06V30/146
摘要：本发明提出了一种基于多尺度卷积的极端长宽比文本检测方法及系统，涉及文本检测技术领域。本申请一方面在场景文本极端长宽比文本的检测问题上，通过改进的框生成算法修改了文本收缩距离，使得收缩距离可根据不同的长宽比进行收缩。从而扩大标注框面积，从数据角度降低极端长宽比对阈值的敏感度以及易于被检测为两段的概率。另一方面，通过在DBNet网络的基础上，添加基于注意力机制的多尺度卷积融合模块，从通道层面考虑了每个尺度卷积的重要性。模型可在训练过程中，自适应的根据数据集调整在每个通道的重要性，提升模型在极端长宽比文本上的检测性能。

一种协同门控循环融合LSTM图像标注方法-202110794816.6
发明人：杨有;陈立志;胡峻滔;余平;杨学森 -专利权人：重庆师范大学
申请日： 2021-07-14 - 公布日： 2023-09-12 - 主分类号： G06V30/146
摘要：本发明涉及协同门控循环融合领域，具体涉及一种协同门控循环融合LSTM图像标注方法，通过协同门控注意方法执行图像‑文本匹配的多模态任务；由生成注意权值的注意LSTM循环融合组成注意rLSTM；由生成单词的语言LSTM循环融合组成语言rLSTM；把协同门控注意SGA和循环融合LSTM整合在一起，形成rLSTM‑SGA；使用数据集对方法进行评论，从而通过SGA方法不仅注意图像的显著区域特征，还可以注意图像的空间特征信息，rLSTM方法，它可以代替传统单一的LSTM单元生成机制，每一时刻通过循环多个相同的LSTM对同一输入进行融合建模，进而对同一语义获取不同的上下文信息，以此提高模型序列学习的能力，生成更加准确的描述语句，整合上述两种创新方法在MSCOCO数据集上进行了评估。

一种基于多图层的医疗发票重叠文字的检测方法及系统-202310605313.9
发明人：方徐伟;李慧;周松;徐小龙 -专利权人：天翼电子商务有限公司
申请日： 2023-05-25 - 公布日： 2023-09-08 - 主分类号： G06V30/146
摘要：本发明公开了一种基于多图层的医疗发票重叠文字的检测方法及系统，涉及图像视觉技术领域。该方法包括：录入目标医疗发票图像，并根据预置的标签制作方案标注和制作目标医疗发票图像的多个标签，每个标签对应一个图层；基于预设的图层分离规则构建医疗发票图像文字检测模型，并构建不同图层的二值map；通过标签训练和监督所有图层的map直到医疗发票图像文字检测模型收敛；基于收敛后的医疗发票图像文字检测模型预测得到不同图层的分割图；根据不同图层的分割图使用反向的Vatti clipping算法得到最终的文本检测框，基于最终的文本检测框进行文字识别。本发明可以有效解决医疗发票中的底板文字和打印文字的检测精准度问题。

证件信息录入方法、装置、电子设备及存储介质-202310620127.2
发明人：刘敏;王帅;杨岩;陈峥 -专利权人：北京啄木鸟云健康科技有限公司
申请日： 2023-05-29 - 公布日： 2023-09-08 - 主分类号： G06V30/146
摘要：本发明实施例涉及一种证件信息录入方法、装置、电子设备及存储介质，通过将待录入信息的证件图像输入到训练好的识别模型中；基于所述特征金字塔网络提取证件图像不同尺度的特征，并将相邻尺度的特征进行级联、特征融合，获得不同尺度的特征图；基于所述区域候选网络生成所述不同尺度的特征图的候选区域框；基于所述级联卷积神经网络输出所述候选区域框的识别结果，所述识别结果包括目标对象类别和目标对象位置，所述目标对象类别为证件图像上的不同属性及属性值；根据属性与对应属性值之间的位置关系确定每个属性对应的属性值，实现属性与对应属性值的结构化录入；即通过改进的深度学习的目标检测，提高了目标检测类别精度和位置精度。

旋转文字检测方法和装置-202211219674.1
发明人：张存义;艾国;杨作兴 -专利权人：深圳比特微电子科技有限公司
申请日： 2022-10-08 - 公布日： 2023-09-08 - 主分类号： G06V30/146
摘要：本公开涉及一种旋转文字检测方法和装置，该方法包括：获取图形样本数据，根据对其中文字图形样本区的标注，得到文字区域框标签值和归一化角度标签值；将图形样本数据输入目标检测模型，得到文字区域框预测值和归一化角度预测值，进而得到文字区域框回归损失和角度归一化回归损失；根据文字区域框回归损失和角度归一化回归损失，得到整体回归损失；根据整体回归损失，调整目标检测模型，得到训练后的目标检测模型；基于训练后的目标检测模型对待检测图形数据进行检测，得到文字区域检测框。本公开中，文字区域框回归损失和角度归一化回归损失各自独立，不影响文字区域框的回归精度，实现了对图形数据中的各种旋转角度文字的端到端的准确检测。

一种仪表识别方法及装置-202011554472.3
发明人：帅民伟;蔡富东;吕昌峰;刘焕云 -专利权人：济南信通达电气科技有限公司
申请日： 2020-12-24 - 公布日： 2023-09-08 - 主分类号： G06V30/146
摘要：本申请公开了一种仪表识别方法及装置，用以解决现有的仪表识别方式中图像采集设备位置需要固定，且不能独立使用采集设备进行检测的问题。通过若干指针式仪表图像样本数据集，对第一神经网络模型进行训练，得到训练后的第一神经网络模型；训练后的第一神经网络模型用于确定仪表图像中表盘的位置与型号；通过图像样本数据集，对第二神经网络模型进行训练，得到训练后的第二神经网络模型；训练后的第二神经网络模型用于确定仪表图像中指针的关键点，以定位指针位置；以及用于确定指针所在窗口的关键点，以定位窗口位置；其中，第一神经网络模型与第二神经网络模型不同。本申请通过上述方法，简化识别步骤，提高对仪表识别的灵活性。

字库视觉重心调整的方法和装置-201911300666.8
发明人：刘成东;贾雪莎;张国江 -专利权人：新方正控股发展有限责任公司;北京北大方正电子有限公司
申请日： 2019-12-17 - 公布日： 2023-09-08 - 主分类号： G06V30/146
摘要：本发明提供一种字库视觉重心调整的方法和装置。该方法包括：终端设备获取字库的各字符的字符编码信息和字库的缩放因子，通过预先训练好的视觉重心网络模型，根据字库文件、各字符的字符编码信息和缩放因子，获取各字符的视觉重心信息，根据各字符的视觉重心信息，对各字符的字形进行调整。本发明的方法，节省了人力成本，同时提高了字库开发的效率。

一种带指数字符的散点图识别方法及装置-202211633805.0
发明人：黄康龙;李华伟;汪亮;赵笑笑;郭令举;任红轩;施兴华;赵宇亮 -专利权人：广东粤港澳大湾区国家纳米科技创新研究院
申请日： 2022-12-19 - 公布日： 2023-09-05 - 主分类号： G06V30/146
摘要：本申请公开了一种带指数字符的散点图识别方法及装置，方法包括：基于目标散点图构建RGB像素矩阵；对RGB像素矩阵进行像素点分析，确定X、Y轴外区域和数据区域；以像素值分析的方式，采用预置字符识别工具、区域划分和拆分机制在X和Y轴外区域识别出刻度信息和标题；采用字符识别工具识别出数据区域的字符信息，根据字符信息对数据区域进行像素点分析，得图例文字；以图例文字为起点寻点分析，根据像素值对比分类出像素点组，再将像素点数量最多的像素点组中第一个像素点作为基准像素点，得图例图像；基于图例图像在数据区域找同类离散点。本申请能够解决现有技术对人工依赖较大，导致信息获取过程效率较差，且可靠性较低的技术问题。

图像倾斜校正的方法、装置、电子设备和存储介质-202010027521.1
发明人：黄雪原;岳爱珍;宋烈金;崔燕 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2020-01-10 - 公布日： 2023-09-01 - 主分类号： G06V30/146
摘要：本申请公开了一种图像倾斜校正的方法、装置、电子设备和存储介质，涉及图像处理领域。具体实现方案为：根据待处理图像中的文本行的外接矩形，对待处理图像进行旋转处理，得到待处理图像的初始校正图像，初始校正图像中的文本行的外接矩形与水平方向垂直或平行；若初始校正图像中的文本行中的文字方向非正立，则对初始校正图像进行旋转处理，得到待处理图像的校正图像，校正图像中的文本行的文字方向为正立。本申请中在根据文本行的外接矩形对图像进行旋转后，还能够根据图像中的文字方向对图像进行90度倍数的旋转处理，使得旋转后的图像中的文字方向均为正立。

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种获取异常文字识别区域的方法、电子设备及存储介质有效

专利文献下载