[发明专利]一种鱼体语义分割方法在审
申请号: | 202310355305.3 | 申请日: | 2023-04-04 |
公开(公告)号: | CN116524181A | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 郭奕;黄佳芯;何模舟;曾柯玮;谢俊杰;邓博奇;先永利;杨颜;苟雪峰;邓名杨 | 申请(专利权)人: | 西华大学 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/82;G06N3/0464;G06N3/08;G06V10/774;G06V10/80;G06V10/764 |
代理公司: | 北京正华智诚专利代理事务所(普通合伙) 11870 | 代理人: | 何凡 |
地址: | 610000 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 分割 方法 | ||
1.一种鱼体语义分割方法,其特征在于,包括以下步骤:
S1、使用双目摄像机在养殖池塘进行水下拍摄得到鱼类图像的数据集;
S2、构建基于MF-Mask R-CNN框架的多任务并行的深度学习模型,并通过数据集对该模型进行训练和测试;
S3、将待分割的鱼体图像输入S2输出的模型中得到鱼体的掩码图像,实现鱼体图像的准确分割。
2.如权利要求1所述的一种鱼体语义分割方法,其特征在于,步骤S1还包括:
将数据集用旋转、裁剪和对比度增强的数据增强方式进行数据增广;
将数据增广后的数据集利用深度学习图像标注软件labelme进行鱼体的手动标注以得到含有鱼体掩码信息的数据集;
将含有鱼体掩码信息的数据集按8:1:1的比例划分为训练集、验证集和测试集。
3.如权利要求2所述的一种鱼体语义分割方法,其特征在于,步骤S2具体包括:
构建基于MF-Mask R-CNN框架的多任务并行的深度学习模型,通过训练集对深度学习模型进行训练,然后通过验证集来验证深度学习模型的精度,最后以测试集作为输入来对深度学习模型的效果进行测试。
4.如权利要求3所述的一种鱼体语义分割方法,其特征在于,所述深度学习模型包括:
特征提取层,采用MF-ResNet101-FPN主干网络,用于提取鱼体图像的特征;其中,MF为Mobile和Former的双向桥接;
区域建议层,为全卷积神经网络,用于寻找鱼体特征区域;
池化层,采用最大池化和平均池化的方式实现鱼体特征图的融合,用于防止模型的过拟合;
多任务分支层,包含鱼体掩码分支、鱼体分类分支和鱼体边界框分支,三个分支结尾连接全卷积网络。
5.如权利要求4所述的一种鱼体语义分割方法,其特征在于,所述双向桥接中Mobile至Former的双桥通信公式为:
其中,Ax→z表示局部特征映射X到全局特征Z的交叉注意力,X表示局部特征,表示第i个head的局部特征,Z表示全局特征,表示第i个head的全局特征,R表示全局特征图,M为自然数,h表示全局划分的数量,d表示维数,WiQ表示第i个head的查询投影矩阵,WO表示多个head投影矩阵的组合,Attn表示标准注意力函数,Q为所查询特征,K表示键,V表示键值,softmax为激活函数,KT表示键的转置,dK表示键为K的维数,[]i=1:h表示h个元素的拼接。
6.如权利要求5所述的一种鱼体语义分割方法,其特征在于,所述双向桥接中Former至Mobile的双桥通信公式为:
其中,AZ→X表示全局特征Z到局部特征X的交叉注意力,X表示局部特征,表示第i个局部特征,Z表示全局特征,表示第i个全局特征,R表示全局特征图,M为自然数,h表示全局划分的数量,d表示维数,WiK和WiV是键和值在Former端的投影矩阵Attn表示标准注意力函数,K表示键,V表示键值,[]i=1:h表示h个元素的拼接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西华大学,未经西华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310355305.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网络服务器机柜
- 下一篇:一种基于影像特征识别的急性脑出血预测系统及方法