[发明专利]一种否定关键词的获取方法及装置和搜索方法及装置有效
申请号: | 201210165406.6 | 申请日: | 2012-05-24 |
公开(公告)号: | CN103425705B | 公开(公告)日: | 2017-07-14 |
发明(设计)人: | 郭雷;孟晓楠 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 苏培华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 否定 关键词 获取 方法 装置 搜索 | ||
1.一种否定关键词的获取方法,其特征在于,包括:
记录依据在页面的访问行为生成的访问行为数据,并在所述访问行为数据中提取访客访问的网页信息,以及各网页信息所对应的一个或多个查询词和各查询词对应的第一特征数据,所述第一特征数据为收益数据;
在预置数据库中提取记录的多个网页信息、各网页信息对应的一个或多个查询词,以及各查询词对应的第二特征数据和点击率,将网页信息、查询词和第一特征收益数据的对应关系,与预置数据库中提取的查询词、第二特征数据和点击率的对应关系进行匹配,得到各网页信息对应的一个或多个查询词,以及各查询词对应的第一特征数据,第二特征数据和点击率,所述第二特征数据为费用数据;
将满足下述任一条件的查询词提取为否定关键词:
条件1、第二特征数据大于第三预设阀值且第三特征收益数据小于第二预设阀值的查询词;
条件2、点击率小于第一预设阀值且第三特征收益数据小于第二预设阀值的查询词;
其中,所述第三特征数据等于第一特征数据,或为第一特征数据与第二特征数据的比值。
2.如权利要求1所述的方法,其特征在于,所述在访问行为数据中提取访问的网页信息,以及各网页信息对应的一个或多个查询词和各查询词对应的第一特征数据的步骤包括:
在访问行为数据中提取访问的网页信息,以及各网页信息所对应的搜索查询词和第一特征数据;
对所述搜索查询词进行归一化处理,得到各网页信息对应的一个或多个查询词,以及各查询词对应的第一特征数据。
3.如权利要求1所述的方法,其特征在于,所述网页信息为广告,所述第一特征数据为收益数据,所述第二特征数据为费用数据。
4.如权利要求1所述的方法,其特征在于,所述第一特征数据包括点击收益数据、登录量、订单量、展现量和交易量中的一种或几种。
5.如权利要求2所述的方法,其特征在于,所述搜索查询词位于,所述访问行为数据的http头信息的referer字段中。
6.如权利要求1所述的方法,其特征在于,所述预置数据库为广告账户。
7.如权利要求6所述的方法,其特征在于,所述广告账户通过以下步骤记录各网页信息对应的查询词,以及各查询词对应的第二特征数据和点击率:
由访客输入的搜索查询词,搜索关键词与之匹配的网页信息并进行展示;
记录访客点击的网页信息、当前搜索查询词、第二特征数据,以及展示的广告网页信息;
针对各网页信息,统计其展示次数和点击次数,并计算各网页信息的点击率;
将记录的各个搜索查询词归一化处理为一个或多个查询词,得到各网页信息对应的一个或多个查询词,以及各查询词对应的第二特征数据和点击率。
8.如权利要求2或7所述的方法,其特征在于,还包括:
将相同的查询词所对应的各个数据进行合并。
9.一种搜索方法,其特征在于,包括:
输入搜索查询词;
将所述搜索查询词与数据库中各网页信息的关键词进行匹配,所述关键词包括匹配关键词和否定关键词,其中,所述否定关键词通过权利要求1-7中任一项得出;
若所述搜索查询词按照预设匹配方式与某网页信息的匹配关键词匹配,且不包含所述否定关键词,则将该网页信息作为搜索结果输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210165406.6/1.html,转载请声明来源钻瓜专利网。