[发明专利]信息处理装置和方法,以及程序存储介质无效

专利信息
申请号: 200680018276.6 申请日: 2006-03-29
公开(公告)号: CN101185073A 公开(公告)日: 2008-05-21
发明(设计)人: 馆野启 申请(专利权)人: 索尼株式会社
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京市柳沈律师事务所 代理人: 黄小临
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 信息处理 装置 方法 以及 程序 存储 介质
【说明书】:

技术领域

本发明涉及信息处理装置和方法以及程序存储介质,并且,具体地,涉及信息处理装置和方法,以及使能够进行适当的集群(clustering)的程序存储介质。

背景技术

集群技术在诸如机器学习和数据开发的领域中起着很重要的作用。例如,在图像识别中、在压缩中的向量量化中、在自然语言处理中的字典的自动生成中等,集群的能力直接影响它们的精度。

现有集群技术主要被分类为分层类型和分区类型。

在可以定义项之间的距离的情况下,分层集群以作为单独的集群(cluster)的每个项开始,并将集群合并到连续更大的集群中。

分区集群(见非专利文件1和2)确定在其中定义了距离和绝对位置的空间上排列的何种程度(degree)的项属于先前所确定的集群中心,并根据其重复计算集群中心。

[非专利文件1]MacQueen,J.,“Some Method for Classification andAnalysis of Multivariate Observations,”Proc.of the 5th Berkeley Symposium onMathematical Statistics and Probability,281-297页,1967。

[非专利文件2]Zhang,B.et al.,“K-Harmonic Means-a Data ClusteringAlgorithm,“Hewlett-Packard Labs Technical Report HPL-1999-124,1999。

发明内容

[本发明要解决的问题]

然而,在分层集群中,根据集群间的距离的定义(例如,在最近相邻方法、最远相邻方法和组平均方法中所定义的距离)创建了不同的集群模式,并且用于不同的集群模式的选择标准并不明确。

此外,通常重复合并直到集群的数量降低为一个,但是,在当已经创建了预定数量的集群时希望停止合并的情况下,通常基于先前以ad hoc为基础确定的阈值距离或集群数量来停止合并。有时采用MDL原理或AIC,但是没有做出它们实际有用的报告。

同样,在分区集群中,需要预先确定集群的数量。

此外,在分层集群和分区集群的每个中,没有可用于从所创建的每个集群中挑选代表项的标准。例如,在分区集群中,通常选择离最后集群的中心最近的项作为该集群的代表,但是不清楚这在人类认知中是什么意思。

本发明已经考虑到上述情况,并且实现了集群,以便确定集群的数量和集群的代表,以符合人类认知模型。

[解决问题的手段]

根据本发明的信息处理设备包括:第一选择装置,用于依次选择将被集群的项作为聚焦项;第二选择装置,用于选择在将被集群的项中接近聚焦项的项作为目标项;计算装置,用于使用基于聚焦项和目标项的普遍性的不对称距离测量计算从聚焦项到目标项的距离和从目标项到聚焦项的距离;和链接装置,用于基于由计算装置所计算的距离把聚焦项和目标项链接到一起。

基于由计算装置所计算的距离,链接装置通过将聚焦项和目标项中的一个作为父母并且另一个作为子女的父母-子女关系把聚焦项和目标项链接到一起。

第二选择装置可以选择最接近聚焦项的项作为目标项。

第二选择装置可以选择接近聚焦项的预定数量的项作为目标项。

链接装置通过父母-子女关系把聚焦项和目标项链接到一起,同时允许聚焦项具有多个父母。

可以确定由于所述链接装置对所有将被集群的项进行的链接而获得的集群根节点是所述集群的代表项。

根据本发明的信息处理方法包括:依次选择将被集群的项作为聚焦项的第一选择步骤;选择在将被集群的项中接近聚焦项的项作为目标项的第二选择步骤;使用基于聚焦项和目标项的普遍性的不对称距离测量计算从聚焦项到目标项的距离和从目标项到聚焦项的距离的计算步骤;和基于在计算步骤中所计算的距离把聚焦项和目标项链接到一起的链接步骤。

根据本发明的程序存储介质包括:依次选择将被集群的项作为聚焦项的第一选择步骤;选择在将被集群的项中接近聚焦项的项作为目标项的第二选择步骤;使用基于聚焦项和目标项的普遍性的不对称距离测量计算从聚焦项到目标项的距离和从目标项到聚焦项的距离的计算步骤;和基于在计算步骤中所计算的距离把聚焦项和目标项链接到一起的链接步骤。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼株式会社,未经索尼株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200680018276.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top