[发明专利]数据处理设备、数据处理方法和程序无效
申请号: | 200910261124.4 | 申请日: | 2009-12-28 |
公开(公告)号: | CN101770507A | 公开(公告)日: | 2010-07-07 |
发明(设计)人: | 浅野康治 | 申请(专利权)人: | 索尼株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L15/02;G10L15/00 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 宋鹤;南霆 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 设备 方法 程序 | ||
技术领域
本发明涉及数据处理设备、数据处理方法和程序。更具体而言,本发明涉及被配置来辅助获取例如语音或图像内容的元数据的数据处理设备、数据处理方法和程序。
背景技术
为了从繁多的电视广播节目的内容中推荐期望内容,例如用户感兴趣的内容,必须检索该期望内容。为了实现内容检索,必须预先向内容指派元数据。
语音识别技术已被考虑来作为向内容指派元数据的方法。
具体而言,在内容包括语音(例如电视广播节目)并且内容的内容数据包括语音数据的情形中,可对语音数据进行语音识别,通过语音识别获得的字词(word)可用作该内容的元数据。
然而,即使在利用能够识别大量字词的大词汇连续语音识别系统执行语音识别的情形中,通过语音识别可获得的字词也限于预先登记在该系统用于语音识别的字典中的那些。
因此,难以获得尚未被登记在字典中的字词(下文称作“未登记字词”)用作元数据。
未登记字词包括最近变得被频繁使用的新近出现的字词(下文称作“新字词”)和诸如不太出名的地点的名称之类的固有名称(propername)。
为了获得这种新字词和固有名称作为元数据,必须将这些未登记字词作为识别目标字词登记到字典中。
然而,将包括新字词和固有名称的未登记字词登记到字典中来增大识别目标字词的数目的作法也导致了执行语音识别过程必需的时间的延长和语音识别的精度降低。
为了提高短话语(utterance)中的字词的识别率,提出了一种执行连续语音识别的方法,在该方法中从要识别的语集(corpus)生成连续语音识别字典,还在考虑到该连续语音识别字典的情况下生成用于提高对未登记字词的识别的补充识别字典,然后使用该连续语音识别字典和补充识别字典二者来执行连续语音识别(例如参见日本未实审专利申请No.2008-242059)。
发明内容
可以通过使用语音检索技术来获得元数据,在该技术中在语音数据中搜索特定字词的话语,并且检测出该特定字词的话语发生的定时(时间)。
具体而言,在语音检索中,可以在语音数据中搜索作为内容的元数据的字词的话语,并且可以获得其话语被包括在该语音数据中的字词作为该内容的元数据。
然而,存在大量的需要作为内容的元数据而获得的字词。如果要检索这样大量的字词,语音检索将花费可观的时间量,导致难以获取元数据。
考虑到前述问题,期望提供一种能辅助获取元数据的技术。
根据本发明的实施例,提供了一种数据处理设备,该数据处理设备包括:语音识别单元,被配置来对语音数据执行连续语音识别;相关字词获取单元,被配置来获取与通过连续语音识别而获得的至少一个字词相关的字词,作为与对应于包括语音数据的内容数据的内容相关的相关字词;以及语音检索单元,被配置来从语音数据检索相关字词的话语来获取已检索出话语的相关字词作为内容的元数据。根据本发明另一个实施例,提供了一种用于使计算机充当该数据处理设备的程序。
根据本发明又一个实施例,提供了一种数据处理方法,该方法包括以下步骤:对语音数据执行连续语音识别;获取与通过连续语音识别而获得的至少一个字词相关的字词,作为与对应于包括语音数据的内容数据的内容相关的相关字词;以及从语音数据检索相关字词的话语来获取已检索出话语的相关字词作为内容的元数据;所述步骤由数据处理设备执行。
在本发明的上述实施例中,对语音数据执行连续语音识别,并且获取与通过连续语音识别而获得的至少一个字词相关的任意字词,作为与对应于包括该语音数据的内容数据的内容相关的相关字词。然后,在该语音数据中搜索该相关字词的话语,并且获得已检索到其话语的相关字词作为该内容的元数据。
注意,该数据处理设备可以是独立的设备,或者可以是一个设备中包括的内部模块。
此外,程序可以提供为通过发送介质发送的程序或者记录在记录介质上的程序。
根据本发明的上述实施例,可以容易地获取元数据。
附图说明
图1是示出了本发明被应用到的记录器的第一实施例的配置示例的框图;
图2是示出了元数据收集过程的流程图;
图3是示出了再现过程的流程图;
图4是示出了本发明被应用到的记录器的第二实施例的配置示例的框图;
图5示出了利用矢量空间方法的话题估计方法;
图6A和6B示出了“tf”和“idf”;
图7是示出了元数据收集方法的另一个流程图;以及
图8是示出了本发明被应用到的计算机的实施例的配置示例的框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼株式会社,未经索尼株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910261124.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于控制有源矩阵有机发光二极管的功率的方法和装置
- 下一篇:输入设备