[发明专利]信息处理装置、信息处理方法以及程序无效
申请号: | 201110135729.6 | 申请日: | 2011-05-20 |
公开(公告)号: | CN102262645A | 公开(公告)日: | 2011-11-30 |
发明(设计)人: | 本间俊一;岩井嘉昭;芦原隆之 | 申请(专利权)人: | 索尼公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F15/18 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;陈炜 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 装置 方法 以及 程序 | ||
1.一种信息处理装置,包括:
数据池生成部,所述数据池生成部生成这样的未知数据池:在包含在数据群中并具有在特征量空间中表示的特征量的数据当中,所述未知数据池包含应被分类成的类别未知的未知数据;
学习样本收集部,所述学习样本收集部执行以下处理:从所述未知数据池中随机地提取一个中心数据;提取在所述特征量空间中具有位于所述中心数据在所述特征量空间中的特征量附近的特征量的邻近数据,其中以所述邻近数据在所述特征量空间中的所述特征量距所述中心数据在所述特征量空间中的所述特征量的距离的升序来提取所述邻近数据,直到所述邻近数据的数目成为预定数目为止;并收集多个学习样本,每个学习样本包含已被提取的所述中心数据和所述邻近数据;
分类器生成部,所述分类器生成部通过使用已被收集到的所述多个学习样本来生成多个分类器;
输出特征量获取部,对于所述数据群中所包含的每个所述数据,所述输出特征量获取部将通过将所述数据输入到所述多个分类器中以识别所述数据而获得的多个输出值作为在与所述特征量空间不同的输出特征量空间中表示的输出特征量而与所述数据相关联;以及
类别分类部,所述类别分类部基于所述输出特征量将所述数据群中所包含的每个所述未知数据分类成预定数目的所述类别中的任一个。
2.根据权利要求1所述的信息处理装置,
其中,所述数据池生成部进一步生成这样的已知数据池:在所述数据群中所包含的所述数据当中,所述已知数据池包含应被分类成的所述类别已知的已知数据;且所述已知数据池具有所述已知数据被分类成的所述类别的标签,并且
其中,所述学习样本收集部进一步从具有同一个所述标签的所述已知数据池中随机地提取预定数目的所述数据,并收集包含所提取的所述数据的学习样本。
3.根据权利要求2所述的信息处理装置,
其中,所述学习样本收集部依据所述已知数据被分类成的所述类别的数目与所述已知数据未被分类成的所述类别的数目的比率,来确定由从所述未知数据中提取的数据形成的学习样本的数目与由从所述已知数据中提取的数据形成的学习样本的数目的比率。
4.根据权利要求1所述的信息处理装置,进一步包括:
维度压缩部,所述维度压缩部对所述输出特征量进行维度压缩,
其中,所述类别分类部基于由所述维度压缩部进行了维度压缩的所述输出特征量来对所述数据进行分类。
5.一种信息处理方法,包括以下步骤:
生成这样的未知数据池:在包含在数据群中并具有在特征量空间中表示的特征量的数据当中,所述未知数据池包含应被分类成的类别未知的未知数据;
从所述未知数据池中随机地提取一个中心数据;提取在所述特征量空间中具有位于所述中心数据在所述特征量空间中的特征量附近的特征量的邻近数据,其中以所述邻近数据在所述特征量空间中的所述特征量距所述中心数据在所述特征量空间中的所述特征量的距离的升序来提取所述邻近数据,直到所述邻近数据的数目成为预定数目为止;并收集多个学习样本,每个学习样本包含已被提取的所述中心数据和所述邻近数据;
通过使用已被收集到的所述多个学习样本来生成多个分类器;
对于所述数据群中所包含的每个所述数据,将通过将所述数据输入到所述多个分类器中以识别所述数据而获得的多个输出值作为在与所述特征量空间不同的输出特征量空间中表示的输出特征量而与所述数据相关联;以及
基于所述输出特征量将所述数据群中所包含的每个所述未知数据分类成预定数目的所述类别中的任一个。
6.一种使得计算机执行以下处理的程序:
生成这样的未知数据池:在包含在数据群中并具有在特征量空间中表示的特征量的数据当中,所述未知数据池包含应被分类成的类别未知的未知数据;
从所述未知数据池中随机地提取一个中心数据;提取在所述特征量空间中具有位于所述中心数据在所述特征量空间中的特征量附近的特征量的邻近数据,其中以所述邻近数据在所述特征量空间中的所述特征量距所述中心数据在所述特征量空间中的所述特征量的距离的升序来提取所述邻近数据,直到所述邻近数据的数目成为预定数目为止;并收集多个学习样本,每个学习样本包含已被提取的所述中心数据和所述邻近数据;
通过使用已被收集到的所述多个学习样本来生成多个分类器;
对于所述数据群中所包含的每个所述数据,将通过将所述数据输入到所述多个分类器中以识别所述数据而获得的多个输出值作为在与所述特征量空间不同的输出特征量空间中表示的输出特征量而与所述数据相关联;以及
基于所述输出特征量将所述数据群中所包含的每个所述未知数据分类成预定数目的所述类别中的任一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110135729.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:包馅米饭及其制作方法
- 下一篇:搜索装置、搜索方法以及程序