[发明专利]一种语义分割方法、装置、设备及介质在审
申请号: | 201811520565.7 | 申请日: | 2018-12-12 |
公开(公告)号: | CN109657715A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 黄国恒;陈俊安;黄斯彤;胡可 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义分割 目标区域 目标帧图像 颜色标记 卷积神经网络 可用性 语义 获取目标 结果图像 图像理解 像素分组 语义含义 帧图像 混淆 保证 | ||
本发明公开了一种语义分割方法、装置、设备及介质。该方法步骤包括:获取目标帧图像,并在目标帧图像中划分多个独立的目标区域;分别对每个目标区域执行基于相应语义分割模型的语义分割操作,生成对应的结果图像;其中,语义分割模型是利用卷积神经网络按目标区域对应的语义划分标准训练生成的。由于本方法是将完整的目标帧图像划分为多个独立的目标区域,各个目标区域的语义分割相互独立,进而相对避免了因用有限种类的颜色标记表征较多种类语义含义的像素分组,而造成颜色标记在后续的图像理解过程中相互混淆的情况发生,以此保证了语义分割结果的可用性。此外,本发明还提供一种语义分割装置、设备及介质,有益效果同上所述。
技术领域
本发明涉及计算机视觉视频检测领域,特别是涉及一种语义分割方法、装置、设备及介质。
背景技术
图像的语义分割可以说是图像理解的基础性技术,在自动驾驶系统(具体为街景识别与理解)、无人机应用(着陆点判断)以及穿戴式设备等应用场景中有着举足轻重的作用。
众所周知的是,图像是由许多像素(Pixel)组成,而语义分割就是将各个像素按照图像中所表达语义含义的不同进行相应的分组(Grouping),在传统的语义分割中,其主要操作内容是将颜色与物体名称进行相关联的命名,进而在对图像进行语义分割后,原图像中不同类型的物体在结果图像中均以相应的颜色覆盖,结果图像中同一颜色的区域即表征相同类型的像素分组。但是在实际使用中,图像中的内容往往较为丰富,进而可能导致基于该图像进行语义分割操作时,像素分组的数量较多的情况,又由于颜色的整体种类相对较少,并且同类颜色中不同色度的颜色之间辨识度较低,因此用有限种类的颜色标记表征较多种类语义含义的像素分组,极易造成不同颜色标记之间的相互混淆,进而在后续的图像理解过程中,可能会丢失部分能够作为重要判别依据的像素信息,因此难以确保语义分割结果的整体可用性。
由此可见,提供一种语义分割方法,以相对避免结果图像中不同颜色标记之间相互混淆的情况,进而保证语义分割结果的可用性,是本领域技术人员亟待解决的问题。
发明内容
本发明的目的是提供一种语义分割方法、装置、设备及介质,以相对避免结果图像中不同颜色标记之间相互混淆的情况,进而保证语义分割结果的可用性。
为解决上述技术问题,本发明提供一种语义分割方法,包括:
获取目标帧图像,并在目标帧图像中划分多个独立的目标区域;
分别对每个目标区域执行基于相应语义分割模型的语义分割操作,生成对应的结果图像;其中,语义分割模型是利用卷积神经网络按目标区域对应的语义划分标准训练生成的。
优选的,在目标帧图像中划分多个独立的目标区域包括:
选取目标帧图像中的关键点;
基于各关键点分别进行池化处理,以在目标帧图像中划分相应的多个独立的目标区域。
优选的,语义分割模型是利用卷积神经网络按目标区域对应的语义划分标准训练生成的具体为:
语义分割模型是利用IndRNN卷积神经网络按目标区域对应的语义划分标准训练生成的。
优选的,分别对每个目标区域执行基于相应语义分割模型的语义分割操作具体为:
分别对每个目标区域中像素点间的互信息执行基于相应语义分割模型的语义分割操作。
优选的,获取目标帧图像具体为获取视频中的目标帧图像。
此外,本发明还提供一种语义分割装置,包括:
获取划分模块,用于获取目标帧图像,并在目标帧图像中划分多个独立的目标区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811520565.7/2.html,转载请声明来源钻瓜专利网。