[发明专利]一种基于随机反馈的限制玻尔兹曼机学习方法与装置在审

申请号：	201710028131.4	申请日：	2017-01-13
公开（公告）号：	CN106779094A	公开（公告）日：	2017-05-31
发明（设计）人：	谭文学;郭国强;汪永琳;王细萍;彭易波;刘亮	申请（专利权）人：	湖南文理学院
主分类号：	G06N99/00	分类号：	G06N99/00
代理公司：	北京风雅颂专利代理有限公司11403	代理人：	李弘
地址：	415000 湖***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于随机反馈限制玻尔兹曼机学习方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及人工智能技术领域，特别地，涉及一种基于随机反馈的限制玻尔兹曼机学习方法与装置。

背景技术

限制玻尔兹曼机(Restricted Boltzmann Machine，RBM)学习是人工智能研究较为年轻的分支，自21世纪以来，在生物特征提取、智能搜索引擎、医学机器诊断、自动检测信用卡欺诈、证券市场决策分析、DNA序列测序、语音和手迹识别等方面有着成功的应用。在这些应用背后，执行一个高效的机器学习过程变得十分关键，期待机器完成任务越复杂，这个过程也就越困难，持续时间就越长，直接制约了模型应用的可行性和实用性。RBM在无监督机器学习领域得到人们的广泛关注，在非结构化模式降维和特征化中得以普遍应用。人们对于特征的“价值取向”是因任务而异的，降维和特征提取方法不能一成不变。如何改进RBM学习方法，更快地训练得到收敛性更高的机器模型成为一个期待解决的先要问题。

限制玻尔兹曼机的训练过程目标是“求样本分布参数的极大似然估计”，即使得目标参数要尽量满足现有样本集合有极大发生概率。这就意味着通过采样函数得到的单个样本也应该有极大概率，至少是局部极大值点，这样才能保障在此条件下求得的参数可能是极大似然估计。然而，已有文献上的k阶梯对比散度方法及其变体均对于k次反向采样得到的样本缺乏评价，将其直接参与梯度上升学习过程，这样导致了2个缺点：一，对任何训练样本统统执行k次采样，在k>1时，需要执行固定数量的采样，学习效率低下，也常常导致一个较长时间的学习过程；二，对于反向采样的样本缺乏评价和比较，无法保证参与参数梯度学习样本的局部最优性，学习机目标函数实现不了有效和平稳收敛，直接影响了降维模型的重构性能。

针对现有技术中限制玻尔兹曼机学习效率低下、不能有效平稳收敛的问题，目前尚未有有效的解决方案。

发明内容

有鉴于此，本发明的目的在于提出一种基于随机反馈的限制玻尔兹曼机学习方法与装置，能够提高限制玻尔兹曼机的学习效率并有效平稳收敛到极大似然估计。

基于上述目的，本发明提供的技术方案如下：

根据本发明的一个方面，提供了一种基于随机反馈的限制玻尔兹曼机学习方法，包括：

获取所有训练样本并初始化限制玻尔兹曼机的模型参数；

选取训练样本使用限制玻尔兹曼机进行反馈采样，获得局部最优的重构样本；

根据局部最优的重构样本修正模型参数，并选取下一训练样本进行反馈采样；

对所有训练样本执行反馈采样与模型参数修正，输出模型参数的极大似然估计。

在一些实施方式中，所述限制玻尔兹曼机的模型参数包括可见层偏置的梯度矢量、隐藏层偏置的梯度矢量与连接矩阵偏置的梯度矩阵。

在一些实施方式中，所述选取训练样本使用限制玻尔兹曼机进行反馈采样，获得局部最优的重构样本包括：

选取训练样本作为当前样本，同时初始化误差2-范数与采样计数器；