[发明专利]基于遗传算法优化稀疏自编码器的数据压缩方法及装置在审
申请号: | 202211527709.8 | 申请日: | 2022-12-01 |
公开(公告)号: | CN115796268A | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 何斌;杨振坤;李刚;朱忠攀;陆萍;程斌 | 申请(专利权)人: | 同济大学 |
主分类号: | G06N3/086 | 分类号: | G06N3/086;G06N3/082;G06N3/0455;G06N3/126 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 遗传 算法 优化 稀疏 编码器 数据压缩 方法 装置 | ||
1.一种基于遗传算法优化稀疏自编码器的数据压缩方法,其特征在于,包括以下步骤:
S1:确定稀疏自编码器的网络拓扑结构,初始化稀疏自编码器网络,获得所述稀疏自编码器网络的初始权值和初始阈值;
S2:通过改进遗传算法对所述稀疏自编码器网络的初始权值和初始阈值进行优化,获得稀疏自编码器网络的最优权值、最优阈值以及改进的稀疏自编码器网络;
S3:对未压缩的数据进行归一化处理和数据矫正,获得新的未压缩数据;
S4:将所述新的未压缩数据输入所述改进的稀疏自编码器网络,将隐含层的输出数据作为压缩后的数据;
S5:将压缩后的数据通过算数编码进行无损压缩,获得新的压缩后数据,完成传感数据压缩。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1中,确定稀疏自编码器的网络拓扑结构,包括:
确定稀疏自编码器网络的输入节点数、输出节点数、隐含层层数以及隐含层节点数;
其中,所述输入节点数和所述输出节点数相同,由输入数据的特征维数确定;隐含层层数设置为1;根据下述公式(1)确定隐含层节点数:
其中,h表示网络隐含层节点个数,m表示网络输入节点个数,n表示网络输出节点个数,a为1-10之间的任意一个整数。
3.根据权利要求1所述的方法,其特征在于,所述步骤S2中,通过改进遗传算法对所述稀疏自编码器网络的初始权值和初始阈值进行优化,获得稀疏自编码器网络的最优权值、最优阈值以及改进的稀疏自编码器网络,包括:
S21:通过改进的遗传算法对所述稀疏自编码器网络的初始权值和初始阈值进行编码,得到初始种群;其中,将所有初始权值和初始阈值的编码连接起来即为一个个体的编码;
S22:计算种群中每个个体的适应度值,其中,训练集与测试集数据的均方误差平均值为改进遗传算法的适应度函数,适应度函数可以写为:
其中,N是训练集和测试集总样本数,M是训练集样本数,为稀疏自编码器网络的预测输出,yi为稀疏自编码器网络的期望输出;
S23:通过轮盘赌为个体分配概率进行选择操作,轮盘赌中个体被选中的概率与其适应度值大小成正比,获得稀疏自编码器网络的最优权值、最优阈值以及改进的稀疏自编码器网络,第i个个体被选中的概率pi为:
其中,K是种群的数目,Fi是第i个个体的适应度值。
4.根据权利要求3所述的方法,其特征在于,改进的遗传算法,包括:
对交叉操作进行改进,在算法迭代过程中自适应的调整交叉概率的大小,改进的交叉概率pc为下述公式(4)所示:
其中,f*为种群中两个交叉个体的最大适应度,fmax为整个种群的平均适应度,favg是整个种群的平均适应度,pcmax为最大交叉概率,pcmin为最小交叉概率。
5.根据权利要求4所述的方法,其特征在于,所述步骤S2还包括,根据下述公式(5),对所述改进的遗传算法中的变异操作进行改进:
其中,f为突变个体的适应度值,pmmax为最大变异概率,pmmin为最小变异概率。
6.根据权利要求1所述的方法,其特征在于,所述步骤S3中,对未压缩的数据进行归一化处理和数据矫正,获得新的未压缩数据,包括:
根据下述公式(6)将稀疏自编码器网络的输入参数在各自的维度上进行归一化处理:
其中,x为获得的未压缩数据;xmin为未压缩数据的最小值;xmax为未压缩数据的最大值;x*为新的未压缩数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211527709.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种VR控制系统
- 下一篇:一种3D打印磁响应墨水及其制备方法和应用