[发明专利]一种金丝猴新个体识别方法在审
申请号: | 202210786124.1 | 申请日: | 2022-07-04 |
公开(公告)号: | CN115331134A | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 邓鑫;刘佳;赵玄润;卫毅;许鹏飞;刘焘;郭松涛;杨璐瑶 | 申请(专利权)人: | 西北大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/762;G06V10/764;G06V10/774;G06V40/16 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 李郑建 |
地址: | 710069 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 金丝猴 个体 识别 方法 | ||
1.一种金丝猴新个体识别方法,其特征在于,该方法采用基于孪生网络和深度特征聚类的自监督新个体识别算法,通过引入金丝猴面部图像预训练编码器模块、金丝猴类别数量估计模块、以及无标签数据聚类模块对无身份信息的金丝猴数据进行新个体识别,具体包括如下步骤:
步骤S1:首先使用高分辨率的摄像头采集行金丝猴视频;
步骤S2:对视频进行等间隔的分帧处理,分帧后金丝猴图像使用图像质量评估算法MUSIQ进行评估,将存在严重模糊,抖动的图像筛除;
步骤S3:使用labelme软件对金丝猴面部进行标注,采用目标检测网络yolov5对含有金丝猴面部信息的图像进行面部检测;再将定位好的面部从图像分割出来,得到只包含金丝猴面部的图像;
步骤S4:对检测得到的金丝猴面部图像数据进行预处理,裁剪尺寸到同一大小并对金丝猴面部图像进行矫正处理;
步骤S5:将得到高质量金丝猴面部图像预训练编码器模块,用于提取金丝猴个体的视觉特征,通过从带标签数据中学习的先验知识减少聚类的模糊性,提高对新个体划分的准确率;
步骤S6:金丝猴个体之间的面部图像相似度较大,并考虑到数据集中某些类的图像数量少的问题,该模块利用孪生网络的结构从数据中学习面部视觉特征;
步骤S7:类别数量估计模块,用于估计金丝猴新个体的类别数量,通过知识迁移的方法利用带标记数据的先验知识估计无标签数据的类别个数;
步骤S8:聚类分析模块,通过聚类算法对无标签数据进行聚类,达到个体识别的目的;
步骤S9:将识别准确率高的金丝猴新个体补充到原有数据集中,进行数据增强。
2.如权利要求1所述的方法,其特征在于,所述步骤S2具体实现步骤包括:
步骤S21:首先得到金丝猴图像的多尺度表示,包括原图和固定长宽比缩放的变体,不同尺度的图像被分成固定大小的图像块,然后被送入到以预训练好图像质量评估模型中,由于图像块是来自不同的空间分辨率的图像,需要高效地将这些多种长宽比、多种尺度的输入编码为一个token序列,捕获像素、空间和尺度信息;
步骤S22:基于哈希的二维空间嵌入,记某个图像块的位置在第i行,第j列,被哈希到G×G的网格中的相应的元素;该网格中的每一个元素是一个D维的嵌入向量;即,有一个可学习的矩阵输入的图像尺寸为H,W,并将图像划分为多个尺寸为P的图像块,对于位置在(i,j)的图像块,其空间嵌入被定义为T中的(ti,tj)位置的元素;
步骤S23:对所用的图像复用一个相同的哈希矩阵,HSE是无法分别来自不同尺度的图像块的,因此引入一个额外的尺度嵌入SCE来帮助模型分辨来自不同尺度的图像块;
步骤S24:在ImageNet上做预训练,预训练使用各种数据增广的方法来提升性能;微调则是在图像质量和美学质量数据集上进行,在微调阶段,保持原尺寸图像作为输入,数据增广只采用对图像质量无影响的水平翻转;
步骤S25:使用质量评估算法MUSIQ对采集的金丝猴图像进行质量评估,并设定一个合理的阈值,将低于阈值的图像数据进行筛除。
3.如权利要求1所述的方法,其特征在于,所述步骤S3具体实现步骤包括:
步骤S31:使用labe]me标注工具对金丝猴图像数据的面部进行精细标注,旨在使得目标检测网络能够得到准确得到猴脸的图像坐标信息;
步骤S32:将精细标注后的用于训练检测网络的数据馈入目标检测网络yolo v5,通过反向传播,更新网络参数,直到网络收敛,最终完成目标检测网络yolo v5的预训练;
步骤S33:使用预训练好的模型对未标注的金丝猴图像数据猴脸部分进行裁剪,为后期的金丝猴类别数估计,自监督新个体识别做准备。
4.如权利要求1所述的方法,其特征在于,所述步骤S4具体实现步骤包括:
步骤S41:通过步骤S3得到的金丝猴面部数据,裁剪同一尺寸128*128便于后续模型的处理;
步骤S42:基于仿射变换的金丝猴面部图像进行矫正,对金丝猴面部在旋转过程中的投影变换进行抽象处理并转换为几何模型;从几何模型中解析出猴脸图像的具体变化情况并结合仿射变换理论对人脸在旋转情况下的投影平面图像进行分析,从而实现对猴脸图像的矫正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210786124.1/1.html,转载请声明来源钻瓜专利网。