[发明专利]一种图片推荐方法和装置有效
申请号: | 201210009043.7 | 申请日: | 2012-01-12 |
公开(公告)号: | CN102609458A | 公开(公告)日: | 2012-07-25 |
发明(设计)人: | 路晶 | 申请(专利权)人: | 北京搜狗信息服务有限公司;北京搜狗科技发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 推荐 方法 装置 | ||
技术领域
本申请涉及图片处理技术领域,特别是涉及一种图片推荐方法和装置。
背景技术
目前随着网络技术的不断发展,用户对搜索引擎的要求已经不再满足于只是对文本的搜索,很多用户还希望可以通过搜索引擎对网络图片进行搜索。
目前的图片搜索引擎大都采用基于文本的搜索技术,该技术将图片作为数据库存储的对象,用关键字对其进行描述。然而对于图片中包含的视觉特征,如颜色或形状等,无法用文本进行描述,这样,当需要根据图片中包含的视觉特征搜索图片时,基于文本的搜索技术将不再适用。例如,用户经常遇到这样的问题,在网站或电脑上看到一张包含物品的图片,但并不知道该图片中的物品是什么,故很难将该物品的视觉特征用语言描述出来,即便表达能力好的用户将其视觉特征描述出来了,也很难在现有的搜索引擎中找到与该图片相似的图片,导致搜索效率低下,使用网络流量较大。
针对上述搜索效率低下、使用网络流量较大的问题,一些图片搜索引擎提供以图搜图功能,该以图搜图功能将视觉内容一致的图片返回给用户,以满足用户的某些搜索需求。例如某些用户爱好搜集图片,最不能容忍的就是美图上面有水印,只要上传图片到图片搜索引擎,轻轻一点便能搜出不带水印的图片;又如,可以上传小图片,搜到这个小图片的各个版本,如清晰大图等。
还有一些图片搜索引擎在提供以图搜图功能的同时提供图片推荐功能,参照图1,示出了现有技术一种图片搜索引擎中图片推荐方法的流程图,具体可以包括:
步骤101、用户提交查询图片;
步骤102、抽取查询图片的颜色、纹理、形状等视觉特征;
步骤103、将查询图片的视觉特征与数据库中图片的视觉特征进行相似性比对;
步骤104、将视觉相似图片推荐给用户。
由于图片推荐结果依据的颜色、纹理、形状等视觉特征比对得到,故这里的视觉相似主要指外观相似,例如用户上传妮可基德曼的图片,图片中妮可基德曼的头发颜色为金色,则图片搜索引擎可能会返回视觉相似的含有金色头发的图片,如金发女郎的图片,有时甚至会返回金毛犬的图片,等等。
但有些用户存在一些个性化需求,如用户上传刘德华的图片,还可能希望看到刘德华的电影海报、个人写真等图片。此时,现有技术中视觉内容一致的搜索结果和视觉相似的图片推荐结果均不能满足用户的个性化需求。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够提供契合用户个性化需求的图片。
发明内容
本申请所要解决的技术问题是提供一种图片推荐方法和装置,能够提供契合用户个性化需求的图片,扩展用户感兴趣信息的获取渠道。
为了解决上述问题,本申请公开了一种图片推荐方法,包括:
接收用户的查询请求,并搜索得到与该查询请求对应的目标图片和与该目标图片相同或近似的结果图片;
依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词,作为该目标图片的关键词;
在搜索日志中进行关键词的匹配,并将与关键词匹配的相应目标图片推荐给用户;所述搜索日志记录有全网用户的在线查询请求对应的目标图片及相应的关键词。
优选的,所述依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词的步骤,包括:
依据对所述网页文本进行聚类分析的结果,去除所述网页文本中孤立的网页文本,得到剩余文本;
抽取所述剩余文本中词频最高并具有实际意义的词或短语,作为描述图片语义特征的关键词。
优选的,通过以下步骤抽取所述剩余文本中具有实际意义的词或短语:
调用预先构造的实体词库,在所述剩余文本中的词或短语与所述实体词库中的实体词相匹配时,保留所述词或短语;所述实体词库存储有具有实际意义的实体词。
优选的,通过以下步骤抽取所述剩余文本中具有实际意义的词或短语:
依据词性抽取所述剩余文本中具有实际意义的词或短语,所述抽取过程包括:
在所述剩余文本中的词或短语为叹词、代词或语气助词中的任一种时,丢弃所述词或短语。
优选的,所述依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词的步骤,还包括:
依据所述关键词与所述剩余文本中其他词汇的相邻共现频率,统计所述剩余文本中与所述关键词相邻的边缘词;将所述边缘词与关键词一起作为描述图片语义特征的关键词。
优选的,所述方法还包括:
在与关键词匹配的相应各目标图片中滤除相同或近似的图片,得到剩余图片;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗信息服务有限公司;北京搜狗科技发展有限公司,未经北京搜狗信息服务有限公司;北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210009043.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多孔球状反应装置及操作方法
- 下一篇:多轴搅拌桩钻机