[发明专利]神经网络模型的训练方法、装置和系统在审

申请号：	202010036613.6	申请日：	2020-01-14
公开（公告）号：	CN113191478A	公开（公告）日：	2021-07-30
发明（设计）人：	陈超;付志航;黄建强;华先胜	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/08;G06K9/62
代理公司：	北京博浩百睿知识产权代理有限责任公司 11134	代理人：	谢湘宁;张文华
地址：	英属开曼群岛大开***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	神经网络模型训练方法装置系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种神经网络模型的训练方法、装置和系统。其中，神经网络模型包括：源域模型和目标域模型，该方法包括：分别将第一类样本数据输入至源域模型以及将第二类样本数据输入至目标域模型，其中，第一类样本数据为带标签的源域样本数据，第二类样本数据为不带标签的目标域样本数据，源域模型和目标域模型共享相同的网络参数；利用预设损失函数对第一类样本数据和第二类样本数据进行损失处理，得到处理结果；根据处理结果对网络参数进行更新，训练得到神经网络模型。本申请解决了现有技术在对神经网络模型进行训练时存在域分布无法准确对齐的技术问题。

技术领域

本申请涉及计算机领域，具体而言，涉及一种神经网络模型的训练方法、装置和系统。

背景技术

目前，人们可通过神经网络(Neural Network)模型可实现系统辨识、模式识别、智能控制等，神经网络模型的使用为人类的科研以及生活等方面带来了方便。而对神经网络模型的训练通常需要大量的有标记的数据，然而获取大量的标记数据的成本比较高。为了解决该问题，现有技术同时利用其它相似领域(即源域)的已标注的数据样本加上需要学习的领域(即目标域)的未标记的样本，学习在目标域具有较好泛化性的模型，该方法为无监督的域自适应算法。

经典的域自适应算法有深度域混淆(Deep Domain Confusion，简称DDC)网络，以及深度自适应网络(Deep Adaptation Network，简称DAN)。上述两种方法均通过双流卷神经网络分别学习源域和目标域模型，并利用最大均值差异来对齐源域和目标域的特征分布。对于DDC，最大均值差异只在最后一个全连接层使用，而DAN是在所有的全连接层使用核化的最大均值差异。其中，最大均值差异(Maximum Mean Discrepancy，简称MMD)是目前域自适应领域中使用最广泛的一种用于度量两个不同分布之间距离的方法。该方法可将两个特征分布在再生希尔伯特空间中的均值的差异作为两个分布的距离。

然而，上述方法只考虑了全局的对齐，并没有考虑类别等语义信息，从而导致部分对齐，甚至错误的对齐，进而降低了神经网络模型在目标域的泛化性能。例如，在手写数字识别的域自适应中，目标域中数字“2”的特征分布可能会被对齐到源域中数字“3”的特征分布，导致“负迁移”。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种神经网络模型的训练方法、装置和系统，以至少解决现有技术在对神经网络模型进行训练时存在域分布无法准确对齐的技术问题。

根据本申请实施例的一个方面，提供了一种神经网络模型的训练方法，包括：分别将第一类样本数据输入至源域模型以及将第二类样本数据输入至目标域模型，其中，第一类样本数据为带标签的源域样本数据，第二类样本数据为不带标签的目标域样本数据，源域模型和目标域模型共享相同的网络参数；利用预设损失函数对第一类样本数据和第二类样本数据进行损失处理，得到处理结果；根据处理结果对网络参数进行更新，训练得到神经网络模型。其中，神经网络模型包括：源域模型和目标域模型。

根据本申请实施例的一个方面，提供了一种数据处理方法，包括：获取待识别对象；采用神经网络模型对待识别对象进行识别，输出识别结果；其中，神经网络模型包括：第一粒度机器学习模型和第二粒度机器学习模型，第一粒度机器学习模型采用第一类样本数据进行训练，第二粒度机器学习模型采用第二类样本数据进行训练，第一类样本数据为带标签的样本数据，第二类样本数据为不带标签的样本数据，第一粒度机器学习模型和第二粒度机器学习模型至少共享一部分相同的网络参数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司，未经阿里巴巴集团控股有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010036613.6/2.html，转载请声明来源钻瓜专利网。

上一篇：一种用于测量外径的高精度检测装置及检测方法
下一篇：电子装置、消息播放控制系统以及消息播放控制方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]神经网络模型的训练方法、装置和系统在审

专利文献下载