[发明专利]一种否定关键词的获取方法及装置和搜索方法及装置有效
申请号: | 201210165406.6 | 申请日: | 2012-05-24 |
公开(公告)号: | CN103425705B | 公开(公告)日: | 2017-07-14 |
发明(设计)人: | 郭雷;孟晓楠 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 苏培华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 否定 关键词 获取 方法 装置 搜索 | ||
技术领域
本申请涉及数据处理领域,特别是涉及一种否定关键词的获取方法和装置,以及一种搜索方法和装置。
背景技术
针对搜索引擎关键词竞价广告系统,广告主在系统账户中购买关键词,每个关键词绑定一个广告。当一个用户查询词通过某种匹配方式匹配到广告主购买的关键词时,该关键词所绑定的广告将在查询词搜索结果展示页面显示。
在某些情况下,对于查询词与广告的关键词进行匹配得出的搜索结果,广告主可能并不希望自己的广告出现在这些搜索结果中。例如,某广告主是一个出售电动车器材的商家,设置一个″电动车器材″的词组匹配,当搜索用户搜索″劣质电动车器材商家名录″或者″电动车器材维修点″这类搜索词的时候,该广告主的广告也会显示在搜索结果中,而且有可能显示在左侧搜索结果的上端。
可以通过设定否定关键词来避免这种情况的发生,如上例,可以在该广告的关键词中添加否定关键词“劣质”,即只要用户搜索词中完整的包含了否定关键词(不论以何种词序),该广告都不会展示。当用户搜索″劣质摄影器材商家名录″时就不会展示该广告。当账户包含很多广泛匹配关键词时,否定关键词的作用非常关键。
目前,否定关键词的主要来源是账户的搜索查询报告。投放广告之后,搜索引擎关键词竞价广告系统账户就将访客点击的广告,当前查询词和点击费用数据(用户点击广告后,广告主付给搜索引擎的费用)记录在搜索查询报告中。导出最近一个时期的搜索查询报告,对于点击费用数据比较高,以及点击率(点击次数除以展现次数)比较高的查询词,认为是可能对账户有价值的词,将这类词过滤掉;然后,对过滤后的查询词进行人工审核,再删掉一批可能对账户有价值的词,剩下的作为否定关键词调价到账户中。
以上现有技术中存在的问题是,按照上述方案得到的否定关键词是点击次数较少的查询词,但相对于其较少的点击次数,访客在点击后展示的广告页面中的访问行为(能给广告主带来收益的行为,例如点击、注册、提交订单等)可能并不少,因此,按照上述方法选取否定关键词存在错选漏选的问题,得到的否定关键词不精确。
因此,目前需要本领域技术人员解决的一个技术问题就是,提供一种否定关键词的获取机制,使选取的否定词更为精确,减少错选漏选概率。
发明内容
本申请所要解决的技术问题是提供一种否定关键词的获取方法,使选取的否定词更为精确,减少错选漏选概率。
本申请还提供了一种否定关键词的获取装置,用以保证上述方法在实际中的应用及实现。
为了解决上述问题,本申请公开了一种否定关键词的获取方法,包括:
记录依据在页面的访问行为生成的访问行为数据,并在所述访问行为数据中提取访客访问的网页信息,以及各网页信息所对应的一个或多个查询词和各查询词对应的第一特征数据;
在预置数据库中提取所述查询词对应的第二特征数据和点击率;
将满足下述任一条件的查询词提取为否定关键词:
条件1、第二特征数据大于第三预设阀值且第三特征收益数据小于第二预设阀值的查询词;
条件2、点击率小于第一预设阀值且第三特征收益数据小于第二预设阀值的查询词;
其中,所述第三特征数据等于第一特征数据,或为第一特征数据与第二特征数据的比值。
优选的,所述在访问行为数据中提取访问的网页信息,以及各网页信息对应的一个或多个查询词和各查询词对应的第一特征数据的步骤包括:
在访问行为数据中提取访问的网页信息,以及各网页信息所对应的搜索查询词和第一特征数据;
对所述搜索查询词进行归一化处理,得到各网页信息对应的一个或多个查询词,以及各查询词对应的第一特征数据。
优选的,所述网页信息为广告,所述第一特征数据为收益数据,所述第二特征数据为费用数据。
优选的,所述第一特征数据包括点击收益数据、登录量、订单量、展现量和交易量中的一种或几种。
优选的,所述搜索查询词位于,所述访问行为数据的http头信息的referer字段中。
优选的,所述在预置数据库中提取查询词对应的第二特征数据和点击率的步骤包括:
在预置数据库中提取记录的多个网页信息、各网页信息对应的一个或多个查询词,以及各查询词对应的第二特征数据和点击率;
将网页信息、查询词和第一特征收益数据的对应关系,与预置数据库中提取的查询词、第二特征数据和点击率的对应关系进行匹配,得到各网页信息对应的一个或多个查询词,以及各查询词对应的第一特征数据,第二特征数据和点击率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210165406.6/2.html,转载请声明来源钻瓜专利网。