[发明专利]确定中心词的方法及装置、搜索方法及装置有效
申请号: | 201110369651.4 | 申请日: | 2011-11-18 |
公开(公告)号: | CN103123624A | 公开(公告)日: | 2013-05-29 |
发明(设计)人: | 谈云兵;李连华 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 中心词 方法 装置 搜索 | ||
1.一种确定中心词的方法,其特征在于,包括:
将用户输入的搜索关键词划分为各关键词单元;并
确定划分出的各关键词单元的词性;
从划分出的各关键词单元中,提取出词性为名词的关键词单元;并
将提取出的关键词单元确定为所述搜索关键词的中心词。
2.如权利要求1所述的方法,其特征在于,还包括:
针对提取出的每个关键词单元,分别将该关键词单元与词性为预定词性的关键词单元进行组合,得到各关键词单元组合;
将得到的各关键词单元组合,确定为所述搜索关键词的中心词。
3.如权利要求2所述的方法,其特征在于,将得到的各关键词单元组合,确定为所述搜索关键词的中心词之前,还包括:
针对得到的每个关键词单元组合,分别确定该关键词单元组合所对应的词性搭配类型,以及获得预先确定的、所述词性搭配类型对应的词性搭配模型,并判断该关键词单元组合是否出现在所述词性搭配模型中;
将得到的各关键词单元组合,确定为所述搜索关键词的中心词,具体包括:
将判断得到出现在所述词性搭配模型中的各关键词单元组合,确定为所述搜索关键词的中心词。
4.如权利要求3所述的方法,其特征在于,将判断得到出现在所述词性搭配模型中的各关键词单元组合,确定为所述搜索关键词的中心词之前,还包括:
针对判断得到出现在所述词性搭配模型中的各关键词单元组合,分别获得预先确定的、该关键词单元组合中词性为名词的关键词单元在所述词性搭配模型中的权重值以及该关键词单元组合在所述词性搭配模型中出现的次数,并判断获得的所述次数是否大于所述权重值的预设倍数;
将判断得到出现在所述词性搭配模型中的各关键词单元组合,确定为所述搜索关键词的中心词,具体包括:
将判断出所述次数大于所述权重值的预设倍数的各关键词单元组合,确定为所述搜索关键词的中心词。
5.如权利要求4所述的方法,其特征在于,关键词单元组合中词性为名词的关键词单元在所述词性搭配模型中的权重值是通过如下方式确定的:
其中,ikf为该关键词单元在所述词性搭配模型中的权重值;
n_freqsum为所述词性搭配模型中,包含该关键词单元的关键词单元组合出现的次数的和;
vn_count为所述词性搭配模型中,与该关键词单元进行组合的其他关键词单元的数目。
6.如权利要求2所述的方法,其特征在于,所述预定词性为下述词性中的至少一种:
动词;
形容词;
名词。
7.如权利要求1所述的方法,其特征在于,在提取出词性为名词的关键词单元之前,还包括:
判断所述搜索关键词的字符数以及划分出的关键词单元的数量是否满足预设条件;
若判断结果为是,则执行提取出词性为名词的关键词单元的操作。
8.如权利要求7所述的方法,其特征在于,所述预设条件为:
所述搜索关键词的字符数不小于第一规定阈值;和/或
划分出的关键词单元的数量不小于第二规定阈值。
9.如权利要求1所述的方法,其特征在于,还包括:
确定划分出的各关键词单元的商业属性;
针对每个关键词单元,分别获得预先确定的、该关键词单元的商业属性所对应的商业属性模型,并判断该关键词单元是否在获得的商业属性模型中;
将判断结果为是的各关键词单元,确定为所述搜索关键词的中心词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110369651.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:镜头模组组装治具
- 下一篇:一种计数精准且分装效率高的药片计数分装机