[发明专利]机器学习装置和方法、分类装置和方法以及记录介质有效
| 申请号: | 201510590503.3 | 申请日: | 2015-09-16 |
| 公开(公告)号: | CN105574536B | 公开(公告)日: | 2020-05-01 |
| 发明(设计)人: | 松永和久 | 申请(专利权)人: | 卡西欧计算机株式会社 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 王亚爱 |
| 地址: | 日本国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 机器 学习 装置 方法 分类 以及 记录 介质 | ||
1.一种机器学习装置,具备存储学习用内容以及试验用内容的存储部和控制部,其特征在于,
所述控制部,具备:
内容获取单元,其获取n个用于将n个学习用内容划分为两个种类的带标签的学习用内容,其中n为2以上的自然数;
特征向量获取单元,其从所述内容获取单元获取到的n个学习用内容之中分别获取表示特征的特征向量;
向量变换单元,其基于学习用内容彼此的类似度,将所述特征向量获取单元获取到的所述n个学习用内容各自的特征向量变换为类似特征向量;
学习单元,其基于所述n个学习用内容各自所附带的标签,以将由该n个学习用内容各自的所述类似特征向量决定的向量空间内的n个点线性分离为两个种类的函数作为分类条件来学习;
分类单元,其按照所述学习单元学习到的分类条件,对未附带所述标签的试验用内容进行种类划分,从而按照所述函数而将所述试验用内容分类为两个种类之中的任一个种类;
取幂单元,其对所述类似特征向量的各分量的类似度的值进行取幂;和
选择单元,其选择所述函数的调整参数和用于所述取幂的取幂参数的组合,该组合使所述分类单元将所述试验用内容分类为所述任一个种类的正确率为最大,
所述学习用内容和所述试验用内容均为图像、声音或者文本。
2.根据权利要求1所述的机器学习装置,其特征在于,
所述向量变换单元生成将行数设为等于所述n个的n行、列数设为等于所述n个的n列、各分量设为所述学习用内容彼此的类似度的n行n列的类似矩阵,并将该生成的类似矩阵的各行的行向量分别作为所述类似特征向量。
3.根据权利要求1所述的机器学习装置,其特征在于,
所述学习单元通过线性支持向量机即线性SVM、k近邻法、朴素贝叶斯分类法、决策树、神经网络、装袋法、提升法或者随机森林法来对线性分离为所述两个种类的函数进行学习。
4.根据权利要求1所述的机器学习装置,其特征在于,
所述向量变换单元将所述特征向量变换为比该特征向量的分量的数即维数更多维数的多维的类似特征向量。
5.根据权利要求1所述的机器学习装置,其特征在于,
所述向量变换单元通过直方图交集来求取所述学习用内容彼此的类似度。
6.根据权利要求1所述的机器学习装置,其特征在于,
所述特征向量获取单元从所述n个学习用内容之中分别获取通过特征包即BoF而将局部特征定量化后的特征向量,并以L1范数或者L2范数对从该n个学习用内容之中分别获取到的特征向量进行标准化。
7.一种分类装置,其特征在于,具备:
未知内容分类单元,其按照权利要求1所述的机器学习装置学习到的分类条件,对与所述学习用内容和所述试验用内容不同的未知的内容进行种类划分。
8.根据权利要求7所述的分类装置,其特征在于,
所述分类装置具备:
获取单元,其从所述未知的内容之中获取表示该未知的内容的特征的特征向量;和
变换单元,其基于所述学习用内容与所述未知的内容的类似度,将所述获取单元获取到的所述未知的内容的特征向量变换为类似特征向量,
所述未知内容分类单元按照所述分类条件对由所述变换单元所变换后的类似特征向量决定的向量空间内的一个点进行分类,由此对所述未知的内容进行种类划分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卡西欧计算机株式会社,未经卡西欧计算机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510590503.3/1.html,转载请声明来源钻瓜专利网。





