[发明专利]用于生成多层神经网络的方法和装置有效
| 申请号: | 201810478003.4 | 申请日: | 2018-05-18 |
| 公开(公告)号: | CN110503181B | 公开(公告)日: | 2022-03-01 |
| 发明(设计)人: | 姜志超 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 生成 多层 神经网络 方法 装置 | ||
本申请实施例公开了用于生成多层神经网络的方法和装置。该方法的一具体实施方式包括:将预先获取到的针对初始多层神经网络的输入数据输入至初始多层神经网络,得到初始多层神经网络所包含的层序列中的各个层的初始输出数据;基于预先获取到的目标输出数据,确定目标层子序列中的各个层的目标输出数据;执行如下更新步骤,以生成新多层神经网络:针对层序列中的每个层,基于该层的初始输出数据和该层的目标输出数据,确定该层的目标权重值,以及将该层的初始权重值更新为该层的目标权重值。该实施方式丰富了多层神经网络的生成方式,有助于提高多层神经网络的训练效率。
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于生成多层神经网络的方法和装置。
背景技术
多层神经网络(Multilayer Perceptron,MLP),即多层感知器,是一种人工神经网络,映射一组输入向量到一组输出向量。多层神经网络可以被看作是一个有向图,由多个节点层组成,每一层全连接到下一层。除了输入节点,每个节点都是一个带有非线性激活函数的神经元(或称处理单元)。
通常情况下,一种被称为反向传播算法的监督学习方法可以被用来训练多层神经网络。
发明内容
本申请实施例提出了用于生成多层神经网络的方法和装置。
第一方面,本申请实施例提供了一种用于生成多层神经网络的方法,该方法包括:将预先获取到的针对初始多层神经网络的输入数据输入至初始多层神经网络,得到初始多层神经网络所包含的层序列中的各个层的初始输出数据;基于预先获取到的目标输出数据,确定目标层子序列中的各个层的目标输出数据,其中,预先获取到的目标输出数据是与输入数据对应的、层序列中的最后一层的目标输出数据,目标层子序列是层序列中除最后一层之外的其他层组成的序列;执行如下更新步骤,以生成新多层神经网络:针对层序列中的每个层,基于该层的初始输出数据和该层的目标输出数据,确定该层的目标权重值,以及将该层的初始权重值更新为该层的目标权重值。
在一些实施例中,基于预先获取到的目标输出数据,确定目标层子序列中的各个层的目标输出数据,包括:基于预先获取到的目标输出数据,针对目标层子序列中的每个层,利用启发法和该层的后一层传到该层的梯度值,确定该层的目标输出数据。
在一些实施例中,上述该层的后一层传到该层的梯度值是基于该层的后一层的目标输出数据和该层的后一层的损失函数得到的。
在一些实施例中,对于上述目标层子序列中的层,该层的损失函数是关于该层的目标输出、该层的初始输出和该层的后一层传到该层的梯度的函数,其中,该层的目标输出的取值为该层的目标输出数据,该层的初始输出的取值为该层的初始输出数据,该层的后一层传到该层的梯度的取值为该层的后一层传到该层的梯度值。
在一些实施例中,输入数据是图像,预先获取到的目标输出数据是用于表征输入的图像是否包括人脸图像的检测结果。
在一些实施例中,上述方法还包括:响应于确定新多层神经网络的准确度大于预设的准确度阈值,存储新多层神经网络。
第二方面,本申请实施例提供了一种用于检测图像的方法,该方法包括:获取待检测图像;将待检测图像输入多层神经网络,生成检测结果,其中,多层神经网络是按照上述用于生成多层神经网络的方法中后两个实施例中任一实施例的方法生成的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810478003.4/2.html,转载请声明来源钻瓜专利网。





