[发明专利]一种应用于神经网络的SQRT激活方法在审

专利信息
申请号: 201810342616.5 申请日: 2018-04-17
公开(公告)号: CN108734273A 公开(公告)日: 2018-11-02
发明(设计)人: 杨小宇;陈宇飞 申请(专利权)人: 同济大学
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08
代理公司: 上海科律专利代理事务所(特殊普通合伙) 31290 代理人: 叶凤
地址: 200092 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 激活单元 神经网络 激活 平方根函数 激活函数 反向传播 数据经线 线性单元 训练过程 鲁棒性 导数 本本发明 方法使用 正向传播 输出 初始化 平方根 弥散 网络 传递 计算机 应用 学习
【权利要求书】:

1.一种新的神经网络的激活方法,其特征在于,该方法使用平方根函数作为神经网络激活函数,在神经网络的训练过程中,数据经线性单元正向传播后,进入激活单元进行激活,激活单元使用平方根函数作为激活函数,将线性单元的每个输出值求其平方值后输出给下一层网络完成激活;数据经线性单元反向传播后,同上进入激活单元激活,此时激活单元使用相应的平方根函数的导数作为激活函数,将线性单元传回的梯度值求平方根导数,然后传递给上一层网络完成误差的反向传播。

2.根据权利要求1所述的一种新的神经网络的激活方法,其特征在于,具体方法过程表征为:

(1)建立神经网络模型,具体实施过程:

(11)根据相应样本要求,选择合适的线性过滤器组成神经网络的线性单元;激活单元使用平方根函数作为激活函数构成;线性单元与激活单元构成一层神经网络,多层神经网络叠加构成神经网络模型,其中层数根据样本要求具体选择;

(12)依据样本特征选择适应的损失函数作为神经网络的顶层,与多层神经网络连接一起完成神经网络模型的构建;

(2)对神经网络进行初始化

完成神经网络的搭建后,采用Xavier随机化方法(此技术已属现有技术)对步骤(1)中构建的神经网络模型进行相应的权重、参数初始化,完成神经网络训练的准备工作

(3)神经网络模型进行训练,激活过程中使用SQRT激活方法,具体实施过程:

发明的平方根函数属于单调递增函数、成中心对称且其导数收敛于0,因此可以使用SQRT激活方法对步骤(1)中构建的神经网络进行激活;算法步骤如下:

(31)神经网络正向传播数据,样本信息经过下层线性单元计算传播至激活单元;

(32)输入数值,计算其中xi是第i个通道的激活神经元对应的输入数值;将每个激活单元所得的计算结果输出、传播至上层神经网络,完成对样本数据的激活;

(33)样本经过多层网络处理后进入顶层,由顶层损失函数计算误差及相应梯度值,并反向传播误差及梯度信息;

(34)神经网络反向传播误差,梯度信息经过上层线性单元计算再传播至激活单元;

(35)输入数值,计算其中xi是第i个通道的激活神经元对应的输入数值;将每个激活单元所得的计算结果输出、传播至下层神经网络,完成对梯度误差的激活与反向传播;

(4)神经网络模型进行测试及使用过程,激活过程中使用SQRT激活方法,具体实施过程:

(41)神经网络正向传播数据,测试样本经过下层线性单元计算,结果传播至激活单元;

(42)输入数值,计算其中xi是第i个通道的激活神经元对应的输入数值;将每个激活单元所得的计算结果输出,并传播至上层神经网络,完成对样本数据的激活。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810342616.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top