[发明专利]一种基于自适应权重的复杂图片聚类方法在审
申请号: | 202110740031.0 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113449138A | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 任亚洲;杨之蒙;吴子锐 | 申请(专利权)人: | 电子科技大学广东电子信息工程研究院 |
主分类号: | G06F16/55 | 分类号: | G06F16/55;G06K9/62;G06N3/08 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 孟仕杰 |
地址: | 523808 广东省东莞市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自适应 权重 复杂 图片 方法 | ||
1.一种基于自适应权重的复杂图片聚类方法,其特征在于,包括如下步骤:
步骤一、构建图像数据集,将图像数据集划分为训练集和验证集,并对图像进行预处理;
步骤二、构建特征提取网络,特征提取网络包含特征提取部分以及特征提取部分之后连接两层全连接层和一层聚类层;
步骤三、将训练集输入构建好的特征提取网络中进行训练并输出每个样本属于各个类的概率分布矩阵P;
步骤四、根据概率分布矩阵P在聚类层计算出目标概率分布矩阵Q;
步骤五、计算概率分布矩阵P和目标概率分布矩阵Q的交叉熵损失,若交叉熵损失小于阈值,则停止网络训练保存模型,并进入步骤六,若指数损失的变化率大于阈值,则反向传播以样本的熵更新样本的权重,开始新一轮的网络训练,并进入步骤三;
步骤六、将验证集输入步骤五保存的模型中,对模型进行验证。
2.根据权利要求1所述的一种基于自适应权重的复杂图片聚类方法,其特征在于,所述步骤一中,图像数据集为OFFICE-31,该图像数据集按照9:1的比例将所有图像划分为训练集和验证集。
3.根据权利要求2所述的一种基于自适应权重的复杂图片聚类方法,其特征在于,所述步骤一中,图像预处理过程包括对图像进行上采样和下采样操作,其中,上采样采用三次内插法,下采样根据采用目标尺寸以及原有尺寸隔行隔列采样,图像经过上采样和下采样处理后尺寸统一为299*299*3。
4.根据权利要求1所述的一种基于自适应权重的复杂图片聚类方法,其特征在于,所述步骤二中,特征提取网络使用InceptionV3的第一层至倒数第二层作为特征提取部分对图像的特征表示进行提取,初始化参数选择AlexNet参数,参数不冻结。
5.根据权利要求4所述的一种基于自适应权重的复杂图片聚类方法,其特征在于,所述第一层全连接层的神经元数量为256,第二层全连接层输出单元为预聚类簇数,其神经元数量为5。
6.根据权利要求4所述的一种基于自适应权重的复杂图片聚类方法,其特征在于,所述聚类层使用DBSCAN算法对提取的特征表示进行聚类,并用得到的类中心初始化聚类层,其中,使用DBSCAN算法聚类时,采用两个特征向量的二范数计算半径,领域半径设置为0.17,核心对象领域内的最小点数设置为10。
7.根据权利要求1所述的一种基于自适应权重的复杂图片聚类方法,其特征在于,所述步骤四中,目标概率分布矩阵Q的计算公式为:
其中,qij表示样本i属于类别j的概率,pij是qij的目标分布,用于计算神经网络参数更新值,共有n个样本和m个类,l表示分布向低熵优化的步幅大小且l=3。
8.根据权利要求1所述的一种基于自适应权重的复杂图片聚类方法,其特征在于,所述步骤五中,阈值设置为0.001。
9.根据权利要求1所述的一种基于自适应权重的复杂图片聚类方法,其特征在于,所述步骤五中,样本权重更新的方法为:
在第一次迭代时将每个样本的权重设置为1,而后的迭代中,样本权重的更新公式为:
其中,wi是第i个样本的权重,H(pi)是第i个样本的熵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学广东电子信息工程研究院,未经电子科技大学广东电子信息工程研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110740031.0/1.html,转载请声明来源钻瓜专利网。