[发明专利]一种数据处理方法和相关装置有效
申请号: | 201611110268.6 | 申请日: | 2016-12-02 |
公开(公告)号: | CN108153792B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 彭正超;安伟亭;魏虎;李鹏飞;张建锋 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/9538 | 分类号: | G06F16/9538;G06F40/289;G06F40/30;G06F16/9535;G06Q30/0601 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 相关 装置 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
获取目标语义单元,所述目标语义单元为一个用于搜索的搜索语义单元;
将所述目标语义单元划分得到多个分词;
根据分词搜索得到的搜索结果中资源所属类目的数量,以及根据分词搜索得到的搜索结果中资源的所属类目与根据所述目标语义单元搜索得到的搜索结果中资源的所属类目之间重合度确定出所述目标语义单元的核心词;
将根据从所述多个分词中确定出的核心词搜索得到的搜索结果作为根据所述目标语义单元搜索得到的搜索结果;
所述方法还包括:根据第三资源对应的特征值与所述第三资源所属类目的平均特征值确定出所述第三资源的特征值得分;若所述第三资源为具有周期时效性的资源,根据所述第三资源的到期时间确定所述第三资源的加权分;根据所述资源集合的待排序资源中属于所述第三资源所属类目的数量,以及所述资源集合的待排序资源所属类目的总数确定出多样性得分;根据所述第三资源对应的CVR、CTR、特征值得分、加权分和多样性得分,确定出所述第三资源对应的排序得分;其中,所述第三资源为资源集合中的任意一个待排序资源;所述资源集合为搜索结果或待推荐资源。
2.根据权利要求1所述的方法,其特征在于,在所述将所述目标语义单元划分得到多个分词之前,还包括:
若所述目标语义单元的搜索结果中资源数量少于第一阈值,或者所述目标语义单元的字符长度多于第二阈值,执行所述将所述目标语义单元划分得到多个分词的步骤。
3.根据权利要求1或2所述的方法,其特征在于,第一分词为所述多个分词中任意一个分词,所述根据分词搜索得到的搜索结果中资源所属类目的数量,以及根据分词搜索得到的搜索结果中资源的所属类目与根据所述目标语义单元搜索得到的搜索结果中资源的所属类目之间重合度确定出所述目标语义单元的核心词,包括:
获取所述第一分词在历史搜索行为中用于搜索的次数、所述第一分词搜索得到的资源数量,以及所述第一分词在历史搜索行为中与其他词共同出现的次数;
根据所述第一分词在历史搜索行为中用于搜索的次数、所述第一分词搜索得到的资源数量、所述第一分词在历史搜索行为中与其他词共同出现的次数、根据所述第一分词搜索得到的搜索结果中资源所属类目的数量,以及根据所述第一分词搜索得到的搜索结果中资源的所属类目与根据所述目标语义单元搜索得到的搜索结果中资源的所属类目之间重合度计算所述第一分词的核心词得分;
若所述第一分词的核心词得分处于所述多个分词中各分词的核心词得分最高的前N位,将所述第一分词确定为所述目标语义单元的核心词。
4.根据权利要求1所述的方法,其特征在于,在将从所述多个分词中确定出的核心词所对应的搜索结果作为所述目标语义单元的搜索结果之后,还包括:
若根据所述目标语义单元搜索得到的搜索结果中资源的数量未满足第三阈值,根据所述目标语义单元进行扩充,得到扩充语义单元,所述扩充语义单元为搜索语义单元;
将根据所述扩充语义单元搜索得到的搜索结果作为根据所述目标语义单元搜索得到的搜索结果。
5.根据权利要求4所述的方法,其特征在于,第一资源为根据所述目标语义单元搜索得到的搜索结果中的任意一个资源,所述根据所述目标语义单元进行扩充,得到扩充语义单元,包括:
若能够根据第一语义单元搜索得到所述第一资源,将所述第一语义单元作为所述扩充语义单元,所述第一语义单元为一个搜索语义单元;或者,
若能够根据第二语义单元搜索得到第二资源,将所述第二语义单元作为所述扩充语义单元,所述第二语义单元为一个搜索语义单元,所述第二资源为与所述第一资源具有相似性的资源。
6.根据权利要求4所述的方法,其特征在于,所述根据所述目标语义单元进行扩充,得到扩充语义单元,包括:
将与所述目标语义单元的编辑距离小于第四阈值的第三语义单元作为所述扩充语义单元,所述第三语义单元为一个搜索语义单元;或者,
将与所述目标语义单元的词义相似度小于第五阈值的第四语义单元作为所述扩充语义单元,所述第四语义单元为一个搜索语义单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611110268.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种资源推荐方法和相关装置
- 下一篇:一种原始数据处理方法