[发明专利]一种融合文本语义和视觉内容的Web人像检索方法无效
| 申请号: | 200810118253.3 | 申请日: | 2008-08-12 |
| 公开(公告)号: | CN101388022A | 公开(公告)日: | 2009-03-18 |
| 发明(设计)人: | 赵耀;谢琳;朱振峰 | 申请(专利权)人: | 北京交通大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京正理专利代理有限公司 | 代理人: | 张占榜 |
| 地址: | 10004*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 融合 文本 语义 视觉 内容 web 人像 检索 方法 | ||
技术领域
本发明涉及一种人像检索方法,特别是指一种融合文本语义和视觉内容的Web检索方法。本发明以Internet环境中的Web人像图片检索为对象,对Web文本语义挖掘与图像视觉内容判别的融合技术进行了较为深入的研究,实现了一个Internet环境下Web人像图片检索的原型系统。
背景技术
随着计算机技术、网络技术和大容量存储技术等的不断发展,以及个人电脑和数字摄像设备的普及,互联网上可获取的多媒体信息的数量也以惊人的速度增长,特别是图像以其直观性和包含信息的丰富性,被广泛地使用并上传至互联网。互联网上信息激增给用户提供丰富资源的同时也带来了挑战:浩如烟海的各类信息无序地分布于各处,往往因为缺乏应有的组织和管理而难以得到有效的利用,这在一定程度上造成了资源的浪费。因此,人们面临的一种迫切需求是,如何从信息的汪洋中,快速有效地定位并获得感兴趣的资源。这种需求也促使了信息检索技术的产生与发展。
随着相关学科的发展,信息检索这个方向的研究热点已经经历了很大的发展与变化,从基于文本的信息检索,到基于内容的图像/视频、音频检索和多媒体检索,以及面向WWW的多媒体检索。检索技术是一项实用性极强的应用型技术,可以应用于如科技查新、新闻广告、安全侦缉、设计制作、休闲娱乐等众多领域。而图像检索作为信息检索十分重要的一个分支,随着多媒体信息处理、数据库及计算机互联网等技术相互融合与发展,特别是在Internet上资源泛滥的今天,在Internet环境下基于内容的图像检索系统的设计和应用,是一个颇具生命力的研究方向,针对这一方向深入研究,将具有重大的理论价值和广阔的应用前景,其成果对我国此类信息产业的形成与发展将起到积极的促进作用。
在多媒体信息所包含的不同种类中,图像在其中占据着重要的地位。相关研究表明,人类在对物质世界的感知过程中,有80%以上的信息来源于视觉。图像作为一种重要的信息载体,具有形象直观、内容丰富等特点,是组成多媒体的重要内容。同时,图像不仅是除文本外在网络上使用最多的媒体形式,也是表示其他多媒体信息最方便的方式。因此,图像检索技术从20世纪70年代以来逐渐成为了一个非常活跃的研究领域,且在数据库系统和计算机视觉两大研究领域的推动下,又先后分化出基于文本的和基于内容的两个不同的研究角度。
基于文本的信息检索技术在过去的几十年中得到了充分的研究,并已成功运用于商业搜索引擎中。70年代末期,文本检索技术被应用于早期的图像检索中,主要方法是对图像文件标注关键字或文本标题以及一些附加信息,再对图像进行基于关键字的检索,这实质上就是将图像检索转化成为了文本检索问题,即基于文本的图像检索(Text-Based Image Retrieval,TBIR)。目前的多数商业Web图片搜索引擎,如Google、AltaVista、Lycos等,主要都是采用TBIR方法,且其性能通过一些网络分析技术已得到大幅提高,如Google所采用的著名的Page-Rank技术。但是,TBIR往往只分析了文本信息而没有考虑图片的视觉内容,然而随着Web图像的激增,这种采用对图像标注关键词等文本描述信息的方式已不能适应网络信息检索的要求,其局限性也愈加突出:1)对图像标注文本信息需由人工完成,工作乏味冗长且工作量大,且人工标注的速度无法适应多媒体信息爆炸式的增长以及网络的传播速度,这就要求标注必须由人工方式转变为计算机自动的方式;2)由于一些图像所包涵的内容远非少量文本标注所能完整表达的,即所谓的“一图胜千言”,或者如抽象图之类的,其内容又很难用文字来表达,而且不同的人对同一幅图可能又会有不同的理解,同一个人在不同环境条件下对同一幅图也可能会有不同的理解,这些都导致了文本标注不可避免的主观性和不准确性。
于是,在90年代初期,基于内容的图像检索技术(Content-Based ImageRetrieval,CBIR)应运而生。区别于基于文本检索的系统中对图像进行人工标注的做法,基于内容的检索技术主要是将图像自身的视觉内容特征作为其索引,如颜色、纹理、形状以及空间关系等底层视觉特征。在检索中,用户提交一幅能代表自己需求的“例子图像”给系统作为查询,系统会返回与此图像在视觉特征上相似的其他图像作为检索结果。CBIR技术之所以优于传统的基于关键字的检索手段,是因为它融合了图像理解、模式识别和计算机视觉等理论,并且综合了人工智能、面向对象技术、认知心理学以及数据库等多领域的知识,这些研究在图像检索的发展过程中是一次巨大的跨越。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810118253.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:制作具有三维立体效果的计算机模拟化学实验方法
- 下一篇:自动锁紧式吊钩装置





