[发明专利]一种图片搜索方法及装置在审
申请号: | 201710527201.0 | 申请日: | 2017-06-30 |
公开(公告)号: | CN107451194A | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 李贤;付立波;李棱;陈雨;龙斌;郭蔚林 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙)11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 搜索 方法 装置 | ||
【技术领域】
本申请涉及互联网应用领域,尤其涉及一种图片搜索方法及装置。
【背景技术】
图片检索(Image Search)是指用户输入自然语言,从图片集合中查找并按相关性等指标,返回排序的图片结果给用户的信息检索(Information Retrieval)过程。
图片搜索引擎(Image Search Engine)就是用于查找互联网图片信息的信息检索工具。现有的图片搜索引擎是对单张图片做召回和排序,搜索结果按图片展开。这种方案满足了用户在互联网上“找图”的需求,但结果页的呈现方式体验不佳。在pc端,结果页每屏可以呈现10-20张图片的缩略图结果;但在移动端,结果页每屏只能呈现4-6张图片结果。
现有图片搜索引擎并未针对图集进行检索,仅有少量高频搜索下的图集结果,所采用的方案是预先根据主题挖掘图集资源并前插到搜索结果中。上述方案存在以下缺点:
1)没有使用搜索引擎技术对图集做建库和检索排序,必须预先针对高频搜索挖掘图集资源,可扩展性和时效性都较差;
2)没有引入图集维度的特征参与排序,不能有效控制图集的相关性和质量;
3)没有引入点击特征形成负反馈机制,低质图集不能在系统内自然沉降。
【发明内容】
本申请的多个方面提供一种图片搜索方法及装置,用以提供图集搜索结果。
本申请的一方面,提供一种图片搜索方法,包括:
接收搜索词;
根据所述搜索词从图片数据库和图集数据库中获取搜索结果项;
对所述搜索结果项进行混合排序;
展示所述排序后的搜索结果项。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述搜索词从图片数据库和图集数据库中获取搜索结果项包括以下子步骤:
在预先建立的图片倒排索引和图集倒排索引中进行搜索,获得与所述搜索词匹配的索引;
获得与所述搜索词匹配的索引对应的图片和图集,生成搜索结果项。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在接收所述搜索词之前,对网络图片进行抓取,建立倒排索引,包括以下子步骤:
对抓取的图片所在网页的结构化文本字段进行分析,获得所述图片的文本信息;
对抓取的图片进行挖掘,生成图集;
建立图集倒排索引。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述对抓取的图片进行挖掘,生成图集包括:
将抓取的图片进行聚合,得到智能聚合图集。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述对抓取的图片进行挖掘,生成图集包括:
将网址的构成特征相似且主题词相同的图片生成网页图集
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述对所述搜索结果项进行混合排序进一步包括以下子步骤:
对图片和图集进行特征提取;
将检索词与待排序的图片和图集的特征数据输入预先训练的排序模型,对各待排序图片和图集进行混合排序。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述展示所述排序后的搜索结果项包括:
将图片和图集的缩略图按混合排序顺序展示在搜索结果页面上。
本发明的另一方面,提供一种图集装置,包括:
接收模块,用于接收搜索词;
搜索模块,用于根据所述搜索词从图片数据库和图集数据库中获取搜索结果项;
排序模块,用于对所述搜索结果项进行混合排序;
展示模块,用于展示所述排序后的搜索结果项。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述搜索模块包括以下子模块:
索引获取子模块,用于在预先建立的图片倒排索引和图集倒排索引中进行搜索,获得与所述搜索词匹配的索引;
搜索结果项生成子模块,用于获得与所述搜索词匹配的索引对应的图片和图集,生成搜索结果项。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述搜索模块还包括倒排索引建立子模块,用于在接收所述搜索词之前,对网络图片进行抓取,建立图集倒排索引,所述倒排索引建立子模块包括:
文本信息获取子模块,用于对抓取的图片所在网页的结构化文本字段进行分析,获得所述图片的文本信息;
图集生成子模块,用于对抓取的图片进行挖掘,生成图集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710527201.0/2.html,转载请声明来源钻瓜专利网。