[发明专利]图像语义分割模型训练方法、图像语义分割方法及装置在审
| 申请号: | 202310023896.4 | 申请日: | 2023-01-09 | 
| 公开(公告)号: | CN115908822A | 公开(公告)日: | 2023-04-04 | 
| 发明(设计)人: | 单国航;贾双成;朱磊;郭杏荣 | 申请(专利权)人: | 智道网联科技(北京)有限公司 | 
| 主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/82;G06V10/44;G06N3/084;G06V10/764;G06V10/774;G06N3/0464 | 
| 代理公司: | 北京汇鑫君达知识产权代理有限公司 11769 | 代理人: | 刘湘菲 | 
| 地址: | 100013 北京市东*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 图像 语义 分割 模型 训练 方法 装置 | ||
本申请涉及一种图像语义分割模型训练方法、图像语义分割方法及装置。该方法包括:根据待分割图像中所有像素的标签真值,对待分割图像进行边缘检测,得到待分割图像每个类别的物体边缘图像;依据待分割图像每个类别的物体边缘图像,获得待训练的图像语义分割模型预测待分割图像中各个类别的每个像素对应的权重;根据待分割图像中各个类别的每个像素对应的权重,获得图像语义分割模型预测待分割图像中各类别的每个像素的损失值;根据损失值,调整图像语义分割模型的参数,获得训练好的图像语义分割模型。本申请提供的方案,能够提高图像语义分割模型的训练效果,提高图像语义分割模型的语义分割准确率。
技术领域
本申请涉及图像处理技术领域,尤其涉及一种图像语义分割模型训练方法、图像语义分割方法及装置。
背景技术
图像语义分割(Semantic Segmentation)是图像处理和是机器视觉技术中关于图像理解的重要一环,也是AI(Artificial Intelligence,人工智能)领域中一个重要的分支。图像语义分割即是对图像中每一个像素点进行分类,确定每个像素点的类别(如属于背景、人或车等),从而进行区域划分。目前,图像语义分割已经被广泛应用于自动驾驶等场景中。
相关技术在使用深度学习进行图像语义分割模型训练时,使用交叉熵等损失函数计算损失值,使用损失值对图像语义分割模型的参数进行调整,完成图像语义分割模型的训练。相关技术在使用交叉熵等损失函数计算损失值时,使用全局平均的方式,当所有像素中有少量比较不好的点时(即求和的部分有少量数值较大),最终的损失值仍然会比较小。在实际使用时,会发现边缘检测结果的边缘误检测比较多,即在边缘位置很容易识别错像素所属的类别;对细长物体的语义分割效果较差,导致使用交叉熵等损失函数获得的损失值不准确,图像语义分割模型的训练效果较差。训练后的图像语义分割模型对细长物体的语义分割不准确,训练后的图像语义分割模型对细长物体的语义分割效果也较差,对细长物体的语义分割的准确率低。
发明内容
为解决或部分解决相关技术中存在的问题,本申请提供一种图像语义分割模型训练方法、图像语义分割方法及装置,能够提高图像语义分割模型的训练效果,提高图像语义分割模型的语义分割准确率。
本申请第一方面提供一种图像语义分割模型训练方法,包括:
根据待分割图像中所有像素的标签真值,对所述待分割图像进行边缘检测,得到所述待分割图像每个类别的物体边缘图像;
依据所述待分割图像每个类别的物体边缘图像,获得待训练的图像语义分割模型预测所述待分割图像中各个类别的每个像素对应的权重;
根据所述待分割图像中各个类别的每个像素对应的权重,获得图像语义分割模型预测所述待分割图像中各类别的每个像素的损失值;
根据所述损失值,调整图像语义分割模型的参数,获得训练好的图像语义分割模型。
本申请第二方面提供一种图像语义分割方法,包括:
获取待分割图像;
将所述待分割图像输入图像语义分割模型,获得图像语义分割模型输出的所述待分割图像对应的分割结果,所述图像语义分割模型根据上述所述的图像语义分割模型训练方法训练得到。
本申请第三方面提供一种图像语义分割模型训练装置,所述装置包括:
第一处理模块,用于根据待分割图像中所有像素的标签真值,对所述待分割图像进行边缘检测,得到所述待分割图像每个类别的物体边缘图像;
第二处理模块,用于依据所述待分割图像每个类别的物体边缘图像,获得待训练的图像语义分割模型预测所述待分割图像中各个类别的每个像素对应的权重;
第三处理模块,用于根据所述待分割图像中各个类别的每个像素对应的权重,获得图像语义分割模型预测所述待分割图像中各类别的每个像素的损失值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智道网联科技(北京)有限公司,未经智道网联科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310023896.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种重载货运列车的制动控制方法及装置
- 下一篇:一种NOR闪存器件的制造方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





