[发明专利]一种基于张量串分解的多层感知机非线性压缩方法在审
申请号: | 202010785534.5 | 申请日: | 2020-08-06 |
公开(公告)号: | CN112116062A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 赵广社;魏育豪;王鼎衡;武碧娇 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 马贵香 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 张量 分解 多层 感知 非线性 压缩 方法 | ||
1.一种基于张量串分解的多层感知机非线性压缩方法,其特征在于,包括以下步骤:
步骤1:对已训练好的多层感知机读取其某一层全连接权重矩阵得该层输入向量为M维,输出向量为N维,即y=f(xW),其中f(·)为该层非线性激活函数;
步骤2:将M和N因数分解为d个整数的乘积,即和将W重构为d阶张量后,利用张量串分解方法得每个因子张量ri为张量秩,有且仅有r0=rd=1;
步骤3:定义输入向量x与张量串分解后的权重相乘得到输出y的前向计算方法使x通过依次与每个相乘,即
步骤4:在每一个计算后插入非线性激活函数g(·),使变为
当步骤4完成后,如果多层感知机中仍有尚未压缩的全连接层,则跳转至步骤1对下一个全连接层进行非线性压缩;如果多层感知机中所有待压缩全连接层皆已压缩,进入步骤5;
步骤5:多层感知机的所有全连接层完成非线性压缩,利用误差反向传播算法对新的多层感知机再进行少量次数的训练以将其微调至最佳性能。
2.根据权利要求1所述的一种基于张量串分解的多层感知机非线性压缩方法,其特征在于,所述步骤2对权重矩阵的维数值M和N以相同的因子数量d进行因数分解。
3.根据权利要求1所述的一种基于张量串分解的多层感知机非线性压缩方法,其特征在于,所述步骤3对输入向量x与张量串分解后的权重相乘得到输出y的前向计算方法定义为如下一系列计算方法的复合:
首先将x重构为矩阵重构为矩阵计算即然后,将X1重构为重构为矩阵计算即依此类推,最后计算并重构之为即
4.根据权利要求1所述的一种基于张量串分解的多层感知机非线性压缩方法,其特征在于,所述步骤4中对每一个计算后插入非线性激活函数g(·),所得新输出y′与原输出y不同;
具体的,首先将x重构为矩阵重构为矩阵计算即接着将X1通过非线性激活函数g(·),进而得到然后,将X″1重构为重构为矩阵计算即接着将X2通过非线性激活函数g(·),进而得到依此类推,使变为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010785534.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种面向超声显微镜的分辨率增强方法
- 下一篇:固定筛网组件的系统、装置和方法