[发明专利]视频聚类方法、排序方法和视频搜索方法以及相应装置有效
申请号: | 201210001972.3 | 申请日: | 2012-01-05 |
公开(公告)号: | CN102542066A | 公开(公告)日: | 2012-07-04 |
发明(设计)人: | 冉阳 | 申请(专利权)人: | 冉阳 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京远大卓悦知识产权代理事务所(普通合伙) 11369 | 代理人: | 刘冬梅 |
地址: | 430071 湖北省武汉*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 方法 排序 搜索 以及 相应 装置 | ||
技术领域
本发明涉及一种视频聚类方法、排序方法和视频搜索方法,具体而言,涉及一种基于视频信息本身而非其文字描述的视频聚类方法、排序方法和视频搜索方法以及相应的装置。
背景技术
随着互联网和多媒体技术的迅速发展,人们可以访问到的多媒体数据急剧增长。视频作为最复杂的一种多媒体数据,凭借其多样化的表现形式、丰富的语义内容以及便捷的记录方式等得到了广泛的应用和发展。与此同时,大容量存储技术的发展使得数字视频信息的存储成本越来越低,这促进了数字视频信息的大量产生和堆积。面对越来越多的海量视频库,如何快速有效地进行视频内容分析和检索就成为当前视频信息领域研究的当务之急。
传统的搜索引擎采用基于文本的PageRank技术(例如,Lawrence Page,Sergey Brin,Rajeev Motwani,TerryWinograd,″The PageRank Citation Ranking:BringingOrder to the Web″,1998;以及Taher H.Haveliwala,″Efficient Computation of PageRank″,Stanford Technical Report,1999)。该技术基于这样一种认识,即一个网页的重要性取决于它被其他网页链接的数量,特别是被一些已经被认定是″重要″的网页的链接数量。
现有的大部分所谓视频搜索引擎也基于文本等第三方因素来辨别视频内容。当一个搜索引擎爬虫在网络中通过URL(Uniform ResourceLocator,统一资源定位符)寻找新的图片/视频链接时(为简单起见,以下以视频为例进行说明),它会通过HTTP协议(HyperTextTransfer Protocol,超文本传输协议)来提取这个网页,并把网页的html(Hypertext Markup Language,文本标记语言)代码传输给内容分析器。内容分析器会根据特定的html代码(例如标签)来寻找网页中所包含的视频。然后,搜索引擎爬虫会根据网页html代码中的title(名称)、heading(标题)、keywords(关键词)、div(描述)等标签及标签中的属性和/或链接到该网页的外部链接来判断视频的内容。当搜索引擎基本判断出视频的内容后,就会按照视频的内容对其进行归类。在确定了视频的内容和分类后,搜索引擎将分析好的数据放置到索引数据库中,并自动为视频生成缩略图。当用户进行搜索时,搜索引擎就会根据视频的内容、与关键词的相关度等因素来对视频进行排序,最终将较准确的搜索结果列表展示给用户。
上述基于文本的视频搜索方法有着先天的缺陷。首先,文字属性标签难以表达蕴藏在多媒体数据中的丰富内容,导致在查询视频时经常会出现错误。其次,文字属性标签是一种人为抽象出来的描述,这使得如果描述的标准改变,则标签也得重新制作才能适合新的查询要求。换句话说,特定的标签只适合特定的查询要求。最后,人为制作出来的文字属性标签受制作者的主观因素影响很大,不同的观察者或同一观察者在不同条件下对同一视频可能会给出不同的描述,因此不够客观且难以统一标准。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于冉阳,未经冉阳许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210001972.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:聚四氟乙烯材料加工助剂自动定量添加装置
- 下一篇:一种可旋转的机械手