[发明专利]优化样本向量的方法及装置、计算机设备在审
申请号: | 201710541204.X | 申请日: | 2017-07-05 |
公开(公告)号: | CN107451662A | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 张志强;周俊;李小龙 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06N99/00 | 分类号: | G06N99/00 |
代理公司: | 北京博思佳知识产权代理有限公司11415 | 代理人: | 林祥 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 优化 样本 向量 方法 装置 计算机 设备 | ||
1.一种优化样本向量的方法,包括:
获取样本数据,所述样本数据包括若干与样本对应的样本向量以及若干与样本特征对应的特征向量,其中每一样本对应于至少一个样本特征;
对于任一待优化样本,利用目标函数,优化与所述待优化样本对应的样本向量及与所述待优化样本的样本特征对应的特征向量,获得优化后所得的样本向量以及特征向量;其中所述目标函数的输出值用以表征所述待优化样本和该待优化样本对应的至少一个样本特征之间的关联度,优化后的样本向量和特征向量使得所述关联度达到优化条件。
2.根据权利要求1所述的方法,所述优化条件为所述关联度达到最高。
3.根据权利要求1所述的方法,所述对于任一待优化样本,利用目标函数,优化与所述待优化样本对应的样本向量及与所述待优化样本的样本特征对应的特征向量,包括:
对于任一待优化样本,从与该待优化样本对应的样本特征中选取至少一个待优化样本特征,获得与所述待优化样本对应的样本向量以及与所述待优化样本特征对应的特征向量;
利用目标函数,优化与所述待优化样本对应的样本向量以及与所述待优化样本特征对应的特征向量;
其中,重复所述选取至少一个待优化样本特征、所述优化与所述待优化样本对应的样本向量以及与所述待优化样本特征对应的特征向量,直至满足迭代终止条件。
4.根据权利要求3所述的方法,所述目标函数为:
其中,c表示选取的待优化样本特征的数量,ufj表示每一与所述待优化样本特征对应的特征向量,ufl表示与样本集对应的特征向量集合中的每一特征向量,所述特征向量集合包含所述样本集涉及的所有特征向量,vi为与所述待优化样本对应的样本向量,h为所述样本集涉及到的特征向量总数。
5.根据权利要求3所述的方法,所述利用目标函数,优化与所述待优化样本对应的样本向量以及与所述待优化样本特征对应的特征向量,包括:
利用目标函数并采用负抽样法和/或层次softmax法,优化与所述待优化样本对应的样本向量以及与所述待优化样本特征对应的特征向量。
6.根据权利要求3所述的方法,所述迭代终止条件包括:
迭代次数超过设定次数;和/或,
前后两次迭代所得的优化后样本向量间的差值小于设定阈值。
7.根据权利要求1所述的方法,所述方法还包括:
将优化后所得的样本向量作为无监督学习任务的输入特征进行机器学习。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710541204.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种柱模加工装置
- 下一篇:一种废旧电能表自动拆上表盖系统