[发明专利]图像识别方法、装置、计算机设备和存储介质在审

专利信息
申请号: 202010108052.6 申请日: 2020-02-21
公开(公告)号: CN111414914A 公开(公告)日: 2020-07-14
发明(设计)人: 陆昱;夏晓玲;万爽 申请(专利权)人: 深圳追一科技有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06K9/46;G06K9/62
代理公司: 广州华进联合专利商标代理有限公司 44224 代理人: 于丽君
地址: 518051 广东省深圳市南山区粤海街道*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请涉及一种图像识别方法、装置、计算机设备和存储介质。所述方法包括:将识别图像与预先构建的参考图像进行匹配,得到所述识别图像与所述参考图像之间的映射关系;所述映射关系用于指示所述识别图像中的识别对象和所述参考图像中的参考对象之间的对应关系;根据所述参考图像中的参考对象和所述映射关系对所述识别图像进行检测,得到所述识别图像中的目标识别区域;根据预先设置的光学字符识别模型对所述目标识别区域进行文字识别,得到所述目标识别区域中的目标字段;根据所述目标字段和所述映射关系,确定所述识别图像中的目标文字信息。通过本发明实施例,缩短了开发时间,降低了开发难度。
搜索关键词: 图像 识别 方法 装置 计算机 设备 存储 介质
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳追一科技有限公司,未经深圳追一科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202010108052.6/,转载请声明来源钻瓜专利网。

同类专利
  • 车牌识别方法、装置、电子设备和存储介质-202111064248.0
  • 孙尚云;许永喜;邓一星 - 北京精英路通科技有限公司
  • 2021-09-10 - 2021-12-31 - G06K9/34
  • 本公开提供了车牌识别方法、装置、电子设备和存储介质,涉及深度学习、计算机视觉、智能交通等领域。具体实现方案为:获取目标车辆的多帧车牌图像;将每帧车牌图像输入车牌识别模型进行车牌识别,以得到每帧车牌图像中各个字符位置对应的标签;根据每帧车牌图像中各个字符位置对应的标签,从多帧车牌图像中筛选掉包含模糊标签和/或遮挡标签的车牌图像,以得到保留的候选车牌图像;根据候选车牌图像,识别目标车辆的车牌。由此,可有效地滤除掉模糊和/或遮挡等无效车牌,对识别效果较好的车牌图像进行识别,提高了车牌的识别精度。
  • 车牌识别方法、装置、电子设备和存储介质-202111064258.4
  • 孙尚云;许永喜;邓一星 - 北京精英路通科技有限公司
  • 2021-09-10 - 2021-12-31 - G06K9/34
  • 本公开提供了车牌识别方法、装置、电子设备和存储介质,涉及深度学习、计算机视觉、智能交通等领域。具体实现方案为:采用车牌识别模型对目标车辆的第一车牌图像进行车牌识别,以得到第一车牌图像中多个字符位置对应的标签,并在多个字符位置对应的标签中存在过曝标签的情况下,根据第一车牌图像中过曝标签对应目标字符位置的亮度,采集目标车辆的第二车牌图像;利用车牌识别模型对第二车牌图像进行车牌识别,以根据第一车牌图像的多个字符位置对应的标签中的字符标签和第二车牌图像中目标字符位置的字符标签,确定目标车辆车牌。由此,在车牌图像中存在过曝区域的情况下,结合多帧车牌图像的识别结果,来确定车牌号码,可提升确定结果的准确性。
  • 一种基于模板的键值对提取方法及系统-202111191056.6
  • 路橙;朱佳豪;梁沛森;陈锦锋;陈武聪;钟建琛;李文浩;邓耀隆 - 广东金赋科技股份有限公司
  • 2021-10-13 - 2021-12-31 - G06K9/34
  • 本发明公开了一种基于模板的键值对提取方法及系统,接收图像,利用文本检测算法DB在图像中找到文本信息,在文本信息的周围形成包围盒;根据预先录入的模板在图像中找到关键词信息,根据关键词信息和包围盒的坐标计算出固定锚点;根据包围盒坐标以及固定锚点计算出可变锚点;根据固定锚点、可变锚点和模板对图像进行投影变换矫正;识别并提取矫正后的包围盒内的文本信息。根据关键词或正则表达式或自定义锚点函数,根据锚点信息进行投影变换矫正,适用于各种文本信息的矫正及提取,提升了图像文字识别的准确率,实际准确率和鲁棒性都优于已有的模板键值对匹配方法。
  • 基于深度学习的中医舌下络脉语义分割提取方法及系统-202010612711.X
  • 周飞;范泽民;胡方锋 - 上海泰怡健康科技有限公司
  • 2020-06-30 - 2021-12-31 - G06K9/34
  • 本发明提供基于深度学习的中医舌下络脉语义分割提取方法及系统,涉及深度学习技术领域,所述方法包括步骤1:对舌体的原始数据进行预处理,得到数据集;步骤2:将数据集输入语义分割网络进行训练和舌体分割预测,并且输出舌体分割预测结果;步骤3:将舌体分割结果输入语义分割网络进行训练和舌下络脉分割预测,并且输出舌下络脉分割预测结果;步骤4:对舌体分割预测结果和舌下络脉分割预测结果进行后处理。本发明能够减少中医的看病成本,充分利用已有的图片数据,基于当前先进的机器学习技术,实现对舌体和舌下络脉的自动分割,将舌体和舌下络脉从背景中提取出来,排除其他信息的干扰,能够促进舌象客观化研究的发展。
  • 安全标示牌分类方法、装置、设备及存储介质-202111114974.9
  • 温景和;黄英杰 - 广东电网有限责任公司;广东电网有限责任公司东莞供电局
  • 2021-09-23 - 2021-12-31 - G06K9/34
  • 本发明公开了一种安全标示牌分类方法、装置、设备及存储介质。一种安全标示牌分类方法包括:获取标示牌的图像数据;基于图像数据获取标示牌的灰度数据;基于灰度数据中表征提示色和禁止色的像素的比例将标示牌分为提示牌和禁止牌,提示牌和禁止牌表征标示牌的类型;基于灰度数据中表征文字的像素的比例分别对提示牌和禁止牌进行标识文字分类。通过计算标示牌的灰度信息,确定各颜色在标示牌上的占比,进而确定标示牌的类别,有效的实现了对标示牌准确高效的进行分类。
  • 评估目标检测模型的方法和系统-202111073590.7
  • 黄江波 - 创新先进技术有限公司
  • 2020-05-07 - 2021-12-28 - G06K9/34
  • 本发明提供一种评估目标检测模型的方法和系统。该方法包括:基于目标检测模型,生成表示目标的预测边界框。该目标位于一个或多个相邻目标附近。该方法还包括确定该预测边界框和该目标的真值边界框之间的交集面积,以及确定该预测边界框和该目标的真值边界框之间的修正并集面积。确定修正并集面积包括:基于一个或多个权重,确定预测边界框和真值边界框之间的加权并集面积,将该预测边界框与所述一个或多个相邻目标的至少一个真值边界框之间的交集面积与加权并集面积相加。该方法进一步包括确定等于所述预测边界框和该目标的真值边界框之间的交集面积除以修正并集面积的分数。该分数代表该目标检测模型的性能。
  • PDF文档的解析方法、装置、电子设备及存储介质-202111082611.1
  • 赵亮 - 深圳壹账通智能科技有限公司
  • 2021-09-15 - 2021-12-28 - G06K9/34
  • 本发明公开了一种PDF文档的解析方法、装置、电子设备及存储介质,该方法包括:根据PDF文档获取页面对象;根据页面对象中直线元素的端点坐标确定横坐标集合和纵坐标集合;根据页面对象中字符元素的坐标确定字符串;根据字符串的坐标和横坐标集合确定字符串的列标识;根据字符串的坐标和纵坐标集合确定字符串的行标识;根据行标识和列标识绘制电子表格。能够准确的确定字符串在电子表格中所在的行标识。根据行标识和列标识准确的将PDF中表格内的字符串提取到电子表格中,提高PDF中表格的解析效率。
  • 一种智慧台灯多分支轻量级残差网络的手写字符识别方法-202111098461.3
  • 毛留锡 - 杭州凯伟科技有限公司
  • 2021-09-18 - 2021-12-28 - G06K9/34
  • 本发明公开了一种智慧台灯多分支轻量级残差网络的手写字符识别方法,包括台灯上设有手写字符识别装置,识别过程如下:手写字符识别就是通过训练出一种识别模型,输出图像中的手写字符,从而转换为可供计算机操作的字符,判断正确答案与识别结果是否相等,来实现对算术题的自动批改功能;本文的样本集被分为训练集和测试集;首先,将训练集先通过深度网络ResNet101训练出深度模型,采用知识蒸馏的方法,使用自己构建的轻量级模型GluNumNet对深度模型的网络参数和损失函数进行学习。该模型能达到深度网络的高精度,同时模型复杂度大大降低。
  • 一种通过工单数据计算车牌识别率的方法-202111107290.6
  • 杨冬;刘文臣;刘响 - 上海顶昂科技有限公司
  • 2021-09-22 - 2021-12-28 - G06K9/34
  • 本发明属于车牌识别率计算技术领域,尤其是一种通过工单数据计算车牌识别率的方法,针对现有的技术采用人工核查视频,将视频实际采集到的车辆画面数据与车牌识别系统获取的车牌数据做计算,效率低的问题,现提出如下方案,其包括以下步骤:S1:从经销商后台系统中拉取当日采集到的车牌识别数据和工单数据;S2:对数据进行清洗,剔除车牌识别数据中的无效值和重复值;S3:将数据进行匹配并分类统计数量,数据分类为:进站识别开单a、进站识别未开单b、进站未识别开单c、未进站未识别开单d;S4:通过公式计算。本发明可以解决传统方式中需要人工逐一检核视频的低效率的问题。
  • 基于可延展2.5D卷积和双路门融合的RGB-D图像语义分割方法-202110966840.3
  • 陈小康;邢亚杰;唐嘉祥;曾钢 - 北京大学
  • 2021-08-23 - 2021-12-28 - G06K9/34
  • 本发明公布了一种基于可延展2.5D卷积和双路门融合的RGB‑D图像语义分割方法,包括:将深度数据的几何信息引入到二维神经网络中,对三维几何关系建模,建立RGB‑D多模态融合算法,利用大规模图像数据集上预训练模型,自适应地为不同环境学习深度感受野参数,为不同环境的几何关系建模,同时从多模态数据中提取互补的信息,生成具有高判别度的特征。本发明有效地解决深度信息存在大量噪音的问题,同时高效地从多模态数据中提取互补的信息,在不同环境的数据中无需调参和重复计算,可有效提升图像语义分割模型方法的性能。
  • 基于图像识别的车型预测方法、装置、设备及介质-202111016962.2
  • 王思敏 - 深圳壹账通智能科技有限公司
  • 2021-08-31 - 2021-12-28 - G06K9/34
  • 本发明涉及人工智能技术领域,尤其涉及一种基于图像识别的车型预测方法、装置、设备及介质。该基于图像识别的车型预测方法包括获取用户终端上传的包含车辆识别号码的车辆图像,并通过OCR模型识别所述车辆图像中的车辆识别号码;对车辆识别号码进行校验,当校验通过时,将车辆识别号码与预先存储的车型数据进行匹配;若匹配失败,则通过车型预测模块实时接收用户上传的视频流;调用目标车型预测模型对多帧车头图像进行预测,输出车型预测信息;通过车辆识别号码修正车型预测信息,输出目标车型信息,返回给用户终端。该方法可在车辆识别号码进行车型匹配失败时,通过综合预测车型信息以及车辆识别号码,准确输出目标车型信息。
  • 一种基于Transformer的端到端实例分割方法-202111005862.X
  • 曹刘娟;胡杰;陆瑶 - 厦门大学
  • 2021-08-30 - 2021-12-24 - G06K9/34
  • 一种基于Transformer的端到端实例分割方法,涉及计算机视觉中的图像检测和分割领域。1)利用卷积网络和具有特征金字塔网络将图像生成特征金字塔;2)利用RoIAlign裁剪并对齐来自金字塔的特征图,提取RoI感兴趣特征区域;3)通过具有动态注意力的Transformers编码器将图像特征和RoI特征图融合到预测头中;4)由预测头输出实例的边界框,低维掩码特征,目标类别;5)反复迭代查询框,并更新预测头输出。在端到端实例分割中使用Transformers,可预测低维掩码特征而不是高维掩码,这不仅简化训练并激发掩码二分匹配代价的设计。可并行检测并分割实例,准确性和运行性能优。
  • 基于双向无监督域适应融合的跨星遥感图像语义分割方法-202111017498.9
  • 尹建伟;蔡钰祥;杨莹春;邓水光;李莹 - 浙江大学
  • 2021-08-30 - 2021-12-24 - G06K9/34
  • 本发明公开了一种基于双向无监督域适应融合的跨星遥感图像语义分割方法,包括源域‑目标域图像双向转换模型训练、图像转换模型双向转换器参数选择、源域‑目标域图像双向转换、源域和拟目标域语义分割模型训练、源域和目标域类别分割概率生成以及融合。本发明利用源‑目标和目标‑源双向域适应,将源域和目标域上类别分割进行概率融合,提高了跨星遥感图像语义分割模型的准确率和鲁棒性,进一步通过双向语义一致损失和转换器参数选择,从而避免了图像双向转换模型中转换器效果不稳定所带来的影响。
  • 健康信息的识别方法和设备-202111436039.4
  • 张冬子;刘丽华;栾润峰 - 北京金和网络股份有限公司
  • 2021-11-30 - 2021-12-24 - G06K9/34
  • 本发明涉及图片识别技术领域,具体涉及一种健康信息的识别方法和设备,方法包括获取待识别用户的健康信息,其中健康信息包括文字信息和颜色信息,对健康信息进行预处理,得到预处理后的标准健康信息,将标准健康信息输入到预先训练的文字信息识别模型中,以便于对文字信息进行识别,得到识别的第一信息,对颜色信息进行识别,得到识别的第二信息,确定第一信息和第二信息是否存在异常,若第一信息和第二信息均表示无异常,则确定健康信息的识别结果为通过。采用本发明的技术方案,可以自动对健康信息进行识别,得到识别结果,相对于人工审核的方式,不仅提高了审核速度,还进一步提高了审核精度。
  • 一种单位车辆智能管理方法及系统-202110923995.9
  • 刘利强;戴燎元 - 湖南匡楚科技有限公司
  • 2021-08-12 - 2021-12-24 - G06K9/34
  • 本发明涉及一种车辆管理的技术领域,揭露了一种单位车辆智能管理方法,包括:将车辆信息输入到车辆管理模块中,利用车辆管理模块实现车辆的筛选和查看;利用结合车辆管理模块的车牌识别模块对外来车辆车牌进行识别,若识别结果为单位车辆,则启用车辆调度管理模块对单位车辆进行调度,若识别结果为非单位车辆,则安排司勤工作人员对其进行调度;利用车辆调度管理模块对单位车辆进行车辆调度;利用车辆管理模块发起车辆维修流程,以及进行维修费用的统计;利用车辆管理模块发起车辆租赁流程,以及进行租赁费用的统计。本发明还提供了一种单位车辆智能管理系统。本发明实现了车辆的智能管理。
  • 图像处理方法、装置、设备和存储介质-202111217656.5
  • 肖佳 - 维沃移动通信有限公司
  • 2021-10-19 - 2021-12-24 - G06K9/34
  • 本申请公开了一种图像处理方法、装置、设备和存储介质,属于图像处理技术领域。该图像处理方法包括:获取目标对象在第一图像中的第一坐标;根据第一图像的尺寸、目标尺寸和第一坐标,确定第二坐标;显示目标尺寸的第二图像,其中,第二图像是基于第一图像生成的,第二图像的中心位置为第二坐标。
  • 图像分割方法及装置,神经网络的训练方法及装置-202111109049.7
  • 孙岩峰;黄文豪;张欢;王少康;陈宽 - 推想医疗科技股份有限公司
  • 2021-09-22 - 2021-12-24 - G06K9/34
  • 本申请公开了一种图像分割方法及装置,神经网络的训练方法及装置。该方法包括:将第一骨影像输入第一神经网络中,得到所述第一骨影像的第一特征图,其中,所述第一神经网络用于对所述第一骨影像进行骨骼的语义分割;根据所述第一骨影像中的局部骨影像,通过第二神经网络,得到所述局部骨影像的第二特征图,其中,所述第二神经网络用于对所述局部骨影像进行骨骼的二值分割;根据所述第一特征图和所述第二特征图,获取骨骼分类分割结果,能够同时提高骨分割和分类的精度和速度。
  • 图像处理方法、图像处理装置、电子设备以及存储介质-202111118378.8
  • 夏晶;赵颖;粘永;孙雄飞;华蔚颖;李曙鹏;施恩 - 北京百度网讯科技有限公司
  • 2021-09-23 - 2021-12-24 - G06K9/34
  • 本公开提供了一种图像处理方法、图像处理装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习领域。具体实现方案为:响应于针对目标图像的分割请求,确定标注信息集,标注信息集包括目标图像数据、第一交互信息集和标注框信息;根据标注框信息,确定第二交互信息集;对目标图像、第一交互信息集和第二交互信息集进行图像分割,得到目标图像的图像分割结果,第一交互信息集包括至少一个第一交互点的第一交互点信息,第二交互信息集包括至少一个第二交互点的第二交互点信息,每个第一交互点位于目标图像中的目标对象区域,每个第二交互点位于目标图像中除目标对象区域以外的非目标对象区域。
  • 图像检测方法及装置-202010514643.3
  • 金美光;刘昕冉;王腾辉 - 阿里巴巴集团控股有限公司
  • 2020-06-08 - 2021-12-24 - G06K9/34
  • 本发明提供了一种图像检测方法及装置,通过获取图像中的文字区域,识别文字区域以获取单字和文本行序列,匹配单字和文本行序列得到文字错误率,将文字错误率与预设的阈值相比较,判断图像是否为模糊图像,提升了模糊图片的筛选识别率,实现了模糊图片的自动化剔除,有效的节省了人力和时间成本。
  • 一种为人脸识别消除人脸图像背景的方法-202010590695.9
  • 王钊 - 深圳君正时代集成电路有限公司
  • 2020-06-24 - 2021-12-24 - G06K9/34
  • 本发明提供一种为人脸识别消除人脸图像背景的方法,在人脸识别过程中尽可能的消除背景信息,例如使它变成纯色例如纯白色。通过本方法利用摄像头拍摄的图像数据中,人脸相对于背景来说运动变化大,而背景相对来说较为静止的特点来工作的。处理过程参考音频处理中的回音消除算法的回波抵消的思路,相对静止的背景信息作为负信号抵消掉人脸图像中对应位置的背景。处理后的结果再通过基本的图像处理二值化,膨胀等方法进行优化。
  • 障碍物分割方法及装置、计算机设备及可读介质-201710098541.6
  • 孙迅;谢远帆;王亮 - 百度在线网络技术(北京)有限公司
  • 2017-02-23 - 2021-12-24 - G06K9/34
  • 本发明提供一种障碍物分割方法及装置、计算机设备及可读介质。其方法包括:从根据当前车辆周围的障碍物点云获取的数个窗口中,获取属于同一预设的邻域区间的多组窗口对;根据当前车辆周围的障碍物点云,获取各组窗口对中的两个窗口的特征信息以及两个窗口的中心点的特征信息;根据各组窗口对中的两个窗口的特征信息、两个窗口的中心点的特征信息以及预先训练的语义特征模型,预测对应的窗口对中的两个窗口的中心点对应的语义特征信息;根据各组窗口对中的两个窗口的中心点对应的语义特征信息,对障碍物点云中各障碍物进行分割。采用本发明的技术方案,能够有效地提高障碍物分割的准确性,进而能够有效地提高对障碍物分割的精度。
  • 建立文字识别模型的方法、装置、设备和计算机存储介质-201910515396.6
  • 姚锟;孙逸鹏;黎健成;韩钧宇;刘经拓;丁二锐 - 北京百度网讯科技有限公司
  • 2019-06-14 - 2021-12-24 - G06K9/34
  • 本发明提供一种建立文字识别模型的方法,所述方法包括:获取包含各文字图像以及各文字图像中所包含文字的识别结果的训练数据;确定包含构建模型结构的卷积神经网络和循环神经网络的各参数以及各参数的取值范围的搜索空间;分别从卷积神经网络以及循环神经网络的各参数的取值范围中进行采样,在利用各参数取值的采样结果得到模型结构序列之后,根据模型结构序列构建对应的模型结构;依据训练数据获取模型结构的奖励值,并确定奖励值是否满足预设条件,若否,则转至执行构建模型结构的步骤,直至模型结构的奖励值满足预设条件,输出模型结构作为最终模型结构;利用训练数据对最终模型结构进行训练,直至最终模型结构收敛,得到文字识别模型。
  • 一种用于复杂应用场景的车辆违停识别方法-202111153392.1
  • 苏元国;汤斌;何鹏;雷斯越;贺渝龙;黄冉 - 重庆市云迈科技有限公司
  • 2021-09-29 - 2021-12-21 - G06K9/34
  • 本发明具体涉及一种用于复杂应用场景的车辆违停识别方法,包括:获取禁停区域内的图像信息;基于禁停区域内的图像信息进行车辆目标检测,并获取对应目标车辆的车辆信息;根据目标车辆的车辆信息判断目标车辆是否移动:若目标车辆移动,基于目标车辆生成对应的疑似违停信息;当目标车辆累积生成两次疑似违停信息后,计算当前的疑似违停信息和上一次的疑似违停信息之间的疑似违停时间差;若疑似违停时间差大于设置的违停时间阈值,则判断目标车辆违停,并生成对应的违停事件信息作为车辆违停识别结果。本发明中的车辆违停识别方法能够在复杂应用场景下有效判断车辆是否违停,从而能够提高车辆违停识别的准确性。
  • 文本内容处理方法、装置、计算机设备及存储介质-202110734235.3
  • 李鑫;王雪初;吴云飞;胡益清 - 腾讯科技(深圳)有限公司
  • 2021-06-30 - 2021-12-21 - G06K9/34
  • 本申请是关于一种文本内容处理方法、装置、计算机设备及存储介质,属于人工智能技术领域。该方法包括:获取目标文本对象中的各个字块,字块是所述目标文本对象中包含连续的文字内容的区域;获取各个字块各自的第一特征,第一特征包含对应字块的图像特征、位置特征以及语义特征;基于各个字块各自的第一特征获取特征矩阵;基于特征矩阵,获取各个字块的邻接矩阵,邻接矩阵用于指示各个字块之间的先后顺序;基于邻接矩阵对各个字块各自对应的文字内容进行排序组合,获得目标文本对象的文本处理结果。基于多模态下的全局考量对文本内容进行处理,进而提高了文本语序还原的准确性。
  • 文本识别方法、装置、系统和非易失性存储介质-202010561370.8
  • 罗楚威;高飞宇;张诗禹;郑琪;王永攀 - 阿里巴巴集团控股有限公司
  • 2020-06-18 - 2021-12-21 - G06K9/34
  • 本发明公开了一种文本识别方法、装置、系统和非易失性存储介质。其中,该方法包括:获取待检测图像数据,其中,待检测图像数据中包括文字信息;对待检测图像数据中的文字进行定位识别,得到多个文本块以及多个文本块的空间位置信息;基于空间位置信息,确定多个文本块中至少两个相邻文本块之间的关联关系;确定关联关系满足预设条件,将至少两个相邻文本块组成一个分词;输出分词。本发明解决了由于文字定位算法的文本框语义单元不固定,文字难以成行、错误成行等所导致的对文本进行识别的效率低的技术问题。
  • 用于进行多目标优化的装置、方法以及存储介质-202010565659.7
  • 孙利;汪留安;孙俊 - 富士通株式会社
  • 2020-06-19 - 2021-12-21 - G06K9/34
  • 本公开内容涉及用于对模型进行多目标优化的装置、方法以及存储介质。根据本公开内容的一个实施例,该装置包括:存储器,存储有指令;以及处理器,处理器被配置从存储器获取指令,并执行指令以:确定模型的模型损失函数;基于模型损失函数和模型的速度指标确定模型的多目标优化函数;以及求解多目标优化函数以确定满足预定要求的选定模型;其中,模型包括用于完成图像任务的多个子模型;模型损失函数为多个子模型中的各子模型的子模型损失函数的加权和;各子模型损失函数的用于加权和的损失权重是通过基于训练样本集以迭代更新方式被确定。本公开内容的方法、装置和存储介质的有益效果至少包括:能够筛选出综合性能良好的模型。
  • 图像语义分割方法、装置、计算机设备及存储介质-202110662643.2
  • 何楠君;卢东焕;李悦翔;马锴;郑冶枫 - 腾讯科技(深圳)有限公司
  • 2021-06-15 - 2021-12-21 - G06K9/34
  • 本申请关于一种图像语义分割方法、装置、计算机设备及存储介质,涉及图像处理技术领域。所述方法包括:获取目标图像;获取目标图像对应在查询维度上的第一向量矩阵,键维度上的第二向量矩阵以及值维度上的第三向量矩阵;对目标向量矩阵中的数值进行n次位置交换,获得n个扩展向量矩阵;基于第一向量矩阵、第二向量矩阵、以及n个扩展向量矩阵,获取自注意力向量矩阵;基于自注意力向量矩阵以及第三向量矩阵获取输出向量矩阵;基于输出向量矩阵,获取目标图像对应的语义分割结果。通过上述方法,使得在获取目标图像的语义分割结果的过程中,能够利用扩展向量矩阵充分挖掘K与Q之间不同特征维度包含的空间信息,进而提高了图像语义分割的精度。
  • 设备视觉检测方法、电子设备、存储介质和程序产品-202111382334.6
  • 刘聪;李晶;刘晓哲;霍玥;曲佳佳;王禹;李春喜 - 北京东方国信科技股份有限公司
  • 2021-11-22 - 2021-12-21 - G06K9/34
  • 本发明提供一种设备视觉检测方法、电子设备、存储介质和程序产品,该方法包括:获取待检测设备的目标图像,目标图像包括待检测目标;将目标图像输入至设备状态检测模型,获得设备状态检测模型输出的状态检测结果,设备状态检测模型用于基于对目标图像进行目标检测和语义分割得到的目标区域图,进行设备状态检测,目标区域图为待检测目标对应的图像;将状态检测结果与待检测设备对应预设规程的状态信息进行对比,获得对比结果;基于对比结果,确定待检测设备是否兑现预设规程。本发明基于进行目标检测和语义分割的设备状态检测模型,对待检测设备进行状态检测,以检测其是否兑现预设规程,实现高准确率的设备视觉检测,从而提高设备运行的安全性。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top