[发明专利]信息处理装置和方法、程序以及记录介质无效
申请号: | 200710161552.0 | 申请日: | 2007-10-08 |
公开(公告)号: | CN101174407A | 公开(公告)日: | 2008-05-07 |
发明(设计)人: | 斋藤真里;小林由幸;木村隆臣 | 申请(专利权)人: | 索尼株式会社 |
主分类号: | G10H1/00 | 分类号: | G10H1/00;G06F17/30 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 | 代理人: | 董方源 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 装置 方法 程序 以及 记录 介质 | ||
技术领域
本发明涉及信息处理装置和方法、程序以及记录介质。特别地,本发明涉及用于处理内容的信息处理装置和方法、程序以及记录介质。
背景技术
将大量乐曲记录到硬盘或闪存中并再现所记录的乐曲的设备正变得越来越普及。正因为可以记录大量乐曲,所以产生了从所记录的那些乐曲中检索出相似乐曲的需要。
存在一种检索相似乐曲的现有技术,该技术基于乐曲的特征量来测量乐曲之间的距离,从而检索得到相似乐曲(例如参考,日本专利早期公开No.2004-171096,称作专利文献1)。
发明内容
但是,通常,如果基于乐曲的特征量之间的相关或距离来定义相似性,则这需要与所存在的乐曲组合一样多的计算。近年来,能够存储几百首到超过一千首乐曲的设备已经很普遍。越多的乐曲存在,则检索相似曲目所需要的处理时间就越长,因而导致大量的处理时间。
另一方面,单纯地选择其特征量之间的欧几里得距离(Euclideandistance)彼此相接近的乐曲,会导致得到不希望的曲目,也就是,将那些用户并不认为相似的曲目确定为相似。
基于欧几里得距离来得到用户认为相似的乐曲的一种可能方法是,创建能够利用基于用户测验中得到的乐曲之间的相似性的主坐标分析(principal coordinate analysis)或增量更新(incremental update)来很好地表示相似性的空间,然后例如通过回归分析(regression analysis)来从乐曲的特征量中估计各个轴的坐标。
但是,收集足够多的、表示乐曲之间相似性的用户测验数据、以便应用上述方法是非常困难,而且并不实际。例如,为了获得关于1450首乐曲之间的相似性程度的测验数据、以便能够应用主坐标分析,则必须输入指示1450首×1450首或两百一十万个模式(pattern)的相似或不相似的数据。
鉴于上述原因而实现了本发明,本发明的一个目的是以更简易、更快速且更精确的方式来识别相似内容。
根据本发明一个实施例的信息处理装置包括转换装置和检索装置。转换装置使用函数来对内容特征量进行转换。所述函数适用于对附于多条内容上的多个特征量进行转换,以使得由所述多个特征量限定的多条内容之间的距离,符合与用户输入的、所述多条内容之间的相似性关系相适应的距离。所述函数还适用于将分布在由所述多个特征量限定的特征量空间中的所述多条内容,映射到通过对所述多个特征量进行转换而得到的新的特征量空间。检索装置基于经转换的特征量来检索出相似内容。
本发明还可以包括提取装置,用以提取内容特征量。
所述检索装置能够通过从已由所述函数转换过其特征量的内容的多个组中的同一组中检索内容,来检索出相似内容。
所述转换装置能够通过应用上述函数来转换内容特征量。所述函数是利用由遗传方法(genetic method)反复生成、直到预定世代数目都不再更新评估值为止而获得的。所述评估值是从两个值中计算得到的信息标准。所述两个值中的一个是表示基于多条内容之间的欧几里得距离的分类程度的值,所述多条内容被认为在由用户输入的、所述多条内容之间的相似性关系中是相似或不相似。所述两个值中的另一个是所述函数的自由参数的数目。
所述转换装置能够通过应用上述函数来转换内容特征量。所述函数是利用遗传方法反复生成、直到预定世代数目都不再更新评估值为止而获得的。所述评估值是根据表示分类程度的FDR(费希尔判别比)来计算得到的。
本发明还可以包括生成装置,用以利用遗传方法来生成所述函数,以使得所述转换装置能够通过应用所生成的函数来转换内容特征量。
本发明还可以包括计算装置,用以从两个值中计算得到作为信息标准的评估值,以使得所述生成装置能够利用遗传方法来生成所述函数,直到预定世代数目都不再更新评估值为止。上述两个值中的一个是表示基于多条内容之间的欧几里得距离的分类程度的值,所述多条内容被认为在由用户输入的、所述多条内容之间的相似性关系中是相似或不相似。另一个是所述函数的自由参数的数目。
所述计算装置根据表示所述分类程度的FDR来计算所述评估值。
本发明还可以包括获取装置,用以获取表示用户输入的、所述多条内容之间的相似性关系的数据,以使得所述计算装置能够使用所述表示用户输入的、所述多条内容之间的相似性关系的数据来计算评估值。
本发明还可以包括群集(clustering)装置,用于基于经转换的特征量来执行内容的群集操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼株式会社,未经索尼株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710161552.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于场景全息再现的投射装置和方法
- 下一篇:用于电池充电器的减压阀