[发明专利]一种广告订单的快速聚类方法及系统、服务器有效
申请号: | 201310567574.2 | 申请日: | 2013-11-14 |
公开(公告)号: | CN104090882A | 公开(公告)日: | 2014-10-08 |
发明(设计)人: | 黄丕培 | 申请(专利权)人: | 深圳市腾讯计算机系统有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 广州三环专利代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 广告 订单 快速 方法 系统 服务器 | ||
技术领域
本发明涉及互联网技术领域,具体涉及一种广告订单的快速聚类方法及系统、服务器。
背景技术
在广告推荐中,通常会存在大量不同的广告订单包含完全相同或极其相似的广告图像的情况,在一些较为极端的情况下,甚至会有多达数千条不同的广告订单包含完全相同或极其相似的广告图像。而在实践中发现,包含完全相同或极其相似的广告图像的不同广告订单所携带的冗余信息通常是不同的,这导致了这类广告订单的稀疏分散,从而影响了这类广告订单投放的效果。
发明内容
本发明实施例公开了一种广告订单的快速聚类方法及系统、服务器,用于实现包含完全相同或极其相似的广告图像的不同广告订单的快速聚类,以利于提升这类广告订单投放效果。
本发明实施例第一方面公开了一种广告订单的快速聚类方法,包括:
从广告订单包含的广告图像中提取出所述广告图像的场景全局语义特征;
利用所述广告图像的场景全局语义特征,获取所述广告图像的图像指纹;
根据获取的任意两条广告订单包含的广告图像的图像指纹,计算所述任意两条广告订单的相似度;
判断所述任意两条广告订单的相似度是否超过预设的相似度阈值,如果是,将所述任意两条广告订单存储至数据库中的同一聚类标识对应的广告订单集合中。
本发明实施例第二方面公开了一种广告订单的快速聚类系统,包括:
特征提取单元,用于从广告订单包含的广告图像中提取出所述广告图像的场景全局语义特征;
指纹获取单元,用于利用所述广告图像的场景全局语义特征获取所述广告图像的图像指纹;
相似度计算单元,用于根据获取的任意两条广告订单包含的广告图像的图像指纹,计算所述任意两条广告订单的相似度;
第一判断单元,用于判断所述任意两条广告订单的相似度是否超过预设的相似度阈值;
存储单元,用于在所述第一判断单元的判断结果为是时,将所述任意两条广告订单存储至数据库中的同一聚类标识对应的广告订单集合中。
本发明实施例第三方面公开了一种用于广告订单快速聚类的服务器,所述服务器用于:
从广告订单包含的广告图像中提取出所述广告图像的场景全局语义特征;
根据所述广告图像的场景全局语义特征获取所述广告图像的图像指纹;
根据获取的任意两条广告订单包含的广告图像的图像指纹,计算所述任意两条广告订单的相似度;
判断所述任意两条广告订单的相似度是否超过预设的相似度阈值;
在所述第一判断单元的判断结果为是时,将所述任意两条广告订单存储至数据库中的同一聚类标识对应的广告订单集合中。
本发明实施例中,从广告订单包含的广告图像中提取出该广告图像的场景全局语义特征后,可以利用该广告图像的场景全局语义特征获取该广告图像的图像指纹,在此基础上,可以根据获取的任意两条广告订单包含的广告图像的图像指纹计算这任意两条广告订单的相似度,并且在判断这任意两条广告订单的相似度超过预设的相似度阈值时,将这任意两条广告订单存储至数据库中的同一聚类标识对应的广告订单集合中。本发明实施例中,任意两条广告订单的相似度超过预设的相似度阈值时,说明这任意两条广告订单包含了完全相同或极其相似的广告图像,通过实施本发明实施例,可以实现包含完全相同或极其相似的广告图像的不同广告订单的快速聚类,以利于提升这类广告订单投放效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种广告订单的快速聚类方法的流程图;
图2是本发明实施例公开的一种普通Hash算法与LSH算法进行GIST特征聚类时的效果对比图;
图3是本发明实施例公开的一种根据SimHash算法和广告图像的GIST特征获取该广告图像的图像指纹的过程示意图;
图4是本发明实施例公开的另一种广告订单的快速聚类方法的流程图;
图5是本发明实施例公开的一种完全相同或极其相似的广告图像的广告订单的示意图;
图6是本发明实施例公开的一种采用计算层、收集层分开作业的方式来执行广告订单的快速聚类的方法流程图;
图7是本发明实施例公开的一种广告订单的快速聚类系统的结构图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市腾讯计算机系统有限公司,未经深圳市腾讯计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310567574.2/2.html,转载请声明来源钻瓜专利网。