[发明专利]信息处理设备和方法、程序和存储介质无效
申请号: | 200810082251.3 | 申请日: | 2008-02-29 |
公开(公告)号: | CN101256583A | 公开(公告)日: | 2008-09-03 |
发明(设计)人: | 高木刚 | 申请(专利权)人: | 索尼株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04N5/445 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 杜娟 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 设备 方法 程序 存储 介质 | ||
相关申请的交叉引用
本发明包含与2007年3月1日在日本专利局提交的日本专利申请JP 2007-051355、2007年8月7日在日本专利局提交的日本专利申请JP 2007-205082、2007年11月26日在日本专利局提交的日本专利申请JP 2007-303992相关的主题,上述申请的全部内容通过引用而被并入在此。
技术领域
本发明涉及信息处理设备和方法、程序和存储介质。更具体地,本发明涉及使得能够从在内容的元数据中包括的信息中有效地提取用于表示内容的特征的最适当的关键词的信息处理设备和方法、程序和存储介质。
背景技术
下述技术正在变得越来越普遍,所述技术用于通过使用包括内容的元数据的、被称为EPG的电子节目指南来选择作为内容的节目,或者用于保留在EPG上选择的节目。
已经提出了一种技术,其使得能够可靠地和容易地提取用于自动记录的更适当的关键词来作为信息(参见日本未审查的专利申请公布第2006-339947号)。
而且,已经提出了一种技术,用于即使在由于时间的过去而导致已经省略了在EPG中包括的节目名称的情况下也可靠地检索期望的节目(参见日本未审查的专利申请公布第2004-134858号)。
发明内容
但是,在现有技术中,当试图从诸如EPG的内容元数据中有效地提取用于表示作为内容的节目的特征的最适当关键词时,产生下面的问题。即,虽然可以通过词素分析(morphological analysis)而找到位置名称或者人名,但是难于识别是否它们是表示节目的特征的最适当的关键词。因此,存在从EPG提取关键词而与是否它们是表示节目的特征的最适当的关键词无关的情况,结果是经常难于仅仅通过查看所提取的关键词而识别节目的特征。
因此,期望使得能够从特别是例如电子节目指南(EPG)的内容的元数据中包括的信息中有效地提取用于表示作为内容的节目的特征的最适当关键词。
按照本发明的一个实施例的一种信息处理设备包括:获取单元,用于获取内容的元数据;词素分析单元,用于对所述内容的元数据中包括的文本信息进行词素分析;类别提取单元,用于提取所述内容的元数据中的每个独立内容的类别信息;以及关键词提取单元,用于通过所述词素分析单元的词素分析结果来提取具有与所述内容的元数据中的预定内容的类别相关的属性的词。
所述词素分析单元可以还包括排除单元,用于排除人名和与所述内容的描述的主旨相关性差的词,并且所述关键词提取单元可以从所述词素分析单元的词素分析结果中提取具有与在所述内容的元数据中的所述预定内容的类别相关的属性的词,其中所述排除单元从所述词素分析结果中排除了人名和与所述内容的描述的主旨相关性差的词。
所述关键词提取单元可以还包括专有名词提取单元,如果从所述词素分析单元的词素分析结果中提取的、具有与在所述内容的元数据中的所述预定内容的类别相关的属性的词的数量不大于预定数量,则所述专有名词提取单元从所述词素分析结果中提取专有名词和具有除了与所述预定内容的类别相关的属性之外的属性的词。
所述信息处理设备可以还包括存储单元,用于存储在所述内容的元数据中的类别和与所述类别相关的属性之间的对应关系,并且所述关键词提取单元可以根据在所述存储单元中存储的、在所述类别和与所述类别相关的属性之间的对应关系来确定与在所述内容的元数据中的所述预定内容的类别相关的属性,并从所述词素分析单元的词素分析结果中提取所确定的词。
所述信息处理设备可以还包括计数单元,用于计数在所述词素分析单元的词素分析结果中的同一词的出现频率,并且所述关键词提取单元可以从所述词素分析单元的所述词素分析结果中以由所述计数单元计数的最高出现频率的顺序提取具有与在所述内容的元数据中的所述预定内容的类别相关的属性的词。
所述类别可以包括主类别和子类别。
所述内容可以包括电视节目,所述元数据可以包括与所述电视节目相关的信息。
按照本发明的一个实施例的一种信息处理方法包括如下步骤:获取内容的元数据;对所述内容的元数据中包括的文本信息进行词素分析;提取所述内容的元数据中的每个独立内容的类别信息;以及通过所述词素分析单元的词素分析结果来提取具有与所述内容的元数据中的预定内容的类别相关的属性的词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼株式会社,未经索尼株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810082251.3/2.html,转载请声明来源钻瓜专利网。