[发明专利]关键词分组方法及系统有效
申请号: | 201110421121.X | 申请日: | 2011-12-15 |
公开(公告)号: | CN103164454A | 公开(公告)日: | 2013-06-19 |
发明(设计)人: | 葛幼姿;于惊涛;广宇昊 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词 分组 方法 系统 | ||
1.一种关键词分组方法,其特征在于,
预先从搜索日志的搜索词中提取关键词建立关键词分类模型,所述关键词分类模型包括关键词的属性及属性的权值;
所述方法包括:
A、利用关键词分类模型,基于关键词的属性对当前推广账户内的关键词进行分类,并确定各关键词的权值;
B、根据关键词与创意之间语义匹配度,分别从各分类的关键词中选出与当前推广账户内的创意之间语义匹配度满足预设匹配度要求的关键词作为种子词;
C、分别以各分类的种子词为核心,基于各关键词的权值对当前推广账户中剩余的关键词进行聚类,得到关键词的分组结果。
2.根据权利要求1所述的方法,其特征在于,预先从搜索日志的搜索词中提取关键词建立关键词分类模型具体包括:
S101、获取搜索日志的搜索词,并对搜索词进行分词处理和过滤处理得到关键词;
S102、提取步骤S101所得到的关键词的属性作为分类特征,所述关键词的属性包括关键词的字面、词义和词性;
S103、为提取得到的各分类特征赋予对应的权值,建立所述关键词分类模型。
3.根据权利要求1所述的方法,其特征在于,所述关键词的权值为:关键词的属性以及关键词的各属性的权值构成的特征向量。
4.根据权利要求1所述的方法,其特征在于,所述关键词与创意之间语义匹配度由关键词代入到创意通配符中时的通顺度以及关键词与创意在语义上的搭配度中的一种或组合确定;
其中所述关键词代入到创意通配符中时的通顺度通过该关键词与创意中各词语的语义相关性,或者通过该关键词与创意中词语的共现概率来计算;
所述关键词与创意在语义上的搭配度通过关键词与创意中各词语的搭配概率来计算。
5.根据权利要求1所述的方法,其特征在于,在执行所述步骤B之前,还包括:
对当前推广账户内的关键词进行商业价值过滤,去掉商业价值低的关键词;
其中关键词的商业价值通过关键词在搜索日志中的检索量、点击率、平均点击价格以及展现量中的至少一种体现。
6.根据权利要求1所述的方法,其特征在于,所述聚类是计算当前推广账户中剩余的关键词与各个种子词之间的差异度,把关键词聚类到差异度最小的种子词所属分类中;
其中关键词与种子词之间的差异度为:关键词与种子词之间各属性的权值之差,或者,关键词的属性和属性的权值构成的特征向量与种子词的属性和属性的权值构成的特征向量之间的相似度。
7.根据权利要求1所述的方法,其特征在于,所述预设匹配度要求包括:
与当前推广账户内的创意之间语义匹配度排在前N1个,N1为预设正整数;
或者,与当前推广账户内的创意之间语义匹配度大于预设阈值。
8.一种关键词分组系统,其特征在于,包括:
分类模型建立模块,用于从搜索日志的搜索词中提取关键词建立关键词分类模型,所述关键词分类模型包括关键词的属性及属性的权值;
分类模块,用于利用分类模型建立模块得到的关键词分类模型,基于关键词的属性对当前推广账户内的关键词进行分类,并确定各关键词的权值;
种子词模块,用于根据关键词与创意之间语义匹配度,分别从各分类的关键词中选出与当前推广账户内的创意之间语义匹配度满足预设匹配度要求的关键词作为种子词;
聚类模块,用于以所述种子词模块得到的种子词为核心,基于各关键词的权值对当前推广账户中剩余的关键词进行聚类,得到关键词的分组结果。
9.根据权利要求8所述的系统,其特征在于,所述分类模型建立模块包括:
获取搜索词子模块,用于获取搜索日志的搜索词,并对搜索词进行分词处理和过滤处理得到关键词;
特征提取子模块,用于提取所述获取搜索词子模块所得到的关键词的属性作为分类特征,所述关键词的属性包括关键词的字面、词义和词性;
权值计算子模块,用于为提取得到的各分类特征赋予对应的权值,建立所述关键词分类模型。
10.根据权利要求8所述的系统,其特征在于,所述分类模块确定的各关键词的权值为:关键词的属性以及各属性的权值构成的特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110421121.X/1.html,转载请声明来源钻瓜专利网。