[发明专利]一种搜索数据处理方法、设备及计算机可读存储介质有效
申请号: | 201810571775.2 | 申请日: | 2018-05-29 |
公开(公告)号: | CN108829800B | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 王秀琳 | 申请(专利权)人: | 努比亚技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/06 |
代理公司: | 深圳智汇远见知识产权代理有限公司 44481 | 代理人: | 田俊峰 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 数据处理 方法 设备 计算机 可读 存储 介质 | ||
本申请涉及一种搜索数据处理方法、设备及计算机可读存储介质,该方法包括:获取搜索对象的待添加标签;确定所述待添加标签与所述搜索对象的关联度;当所述待添加标签与所述搜索对象的关联度超过关联阈值时,关联所述待添加标签与所述搜索对象。该方法使得在对搜索对象创建标签时,可以使得标签与搜索对象相关联,进而在后续利用标签对搜索对象进行搜索时,可以提高搜索的准确性。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种搜索数据处理方法、设备及计算机可读存储介质。
背景技术
近年来,随着Internet的迅速崛起,互联网已日益成为收集提供信息的最佳渠道并逐步进入传统的流通领域。于是电子商务开始流行起来,越来越多的商家在网上建起在线商店,向消费者展示一种新颖的购物理念。
为了便于用户可以在在线商店中快速找到所需的商品,目前很多在线商店都使用搜索推荐系统,搜索推荐系统(如淘宝、应用商店等等)中,搜索的目标对象为了引流,往往尽量多的为自身添加标签,这导致用户搜索到的结果集合中包含大量的非目标对象,降低了搜索的准确率,带来不好的用户体验。
例如:在某网上商城中,用户搜索“茂谷柑”,搜索的目标对象集合中,真正的茂谷柑商品竟然不到10%。而大量的非茂谷柑柑橘,也均在标题中加入了“茂谷柑”、“皇帝柑”等标签,导致搜索的准确率大大降低。另外,当搜索对象的标题中加入类似“非茂谷柑”、“非皇帝柑”、“比皇帝柑还甜”等,这导致在搜索关键词为“茂谷柑”时,这些“非XX”的对象也会匹配检索,降低了搜索准确性。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种搜索数据处理方法、设备及计算机可读存储介质。
有鉴于此,第一方面,本申请提供了一种搜索数据处理方法,其特征在于,包括:获取搜索对象的待添加标签;确定所述待添加标签与所述搜索对象的关联度;当所述待添加标签与所述搜索对象的关联度超过关联阈值时,关联所述待添加标签与所述搜索对象。
可选地,所述确定所述待添加标签与所述搜索对象的关联度,包括:获取所述搜索对象的已添加标签列表;计算所述待添加标签与所述已添加标签列表的相容性;将所述待添加标签与所述已添加标签列表的相容性作为所述关联度。
可选地,所述计算所述待添加标签与所述已添加标签列表的相容性,包括:判断所述已添加标签列表中标签的数量是否为零;当所述已添加标签列表中标签的数量为零时,确定所述待添加标签与所述已添加标列表的相容性为1;
或者,当所述已添加标签列表中标签的数量不为零时,计算所述待添加标签中词语与已添加标签列表中每个标签中词语的子相容性;将值最小的子相容性作为所述待添加标签与所述已添加标列表的相容性。
可选地,所述确定所述待添加标签与所述搜索对象的关联度,包括:从所述搜索对象相对应的详细描述语句提取的关键词,组成关键词列表;计算所述待添加标签与所述关键词列表的相容性;将所述待添加标签与所述关键词列表的相容性作为所述关联度。
可选地,所述计算所述待添加标签与所述关键词列表的相容性,包括:判断所述关键词列表中关键词的数量是否为零;当所述关键词列表中关键词的数量为零时,确定所述待添加标签与所述键词列表的相容性为1;
或者,当所述关键词列表中关键词的数量不为零时,计算所述待添加标签中词语与关键词列表中每个关键词中词语的子相容性;将值最小的子相容性作为所述待添加标签与所述关键词列表的相容性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于努比亚技术有限公司,未经努比亚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810571775.2/2.html,转载请声明来源钻瓜专利网。