[发明专利]对象推荐方法、装置和计算机设备在审
申请号: | 202211510311.3 | 申请日: | 2022-11-29 |
公开(公告)号: | CN115730596A | 公开(公告)日: | 2023-03-03 |
发明(设计)人: | 李宏斌;何雯;何剑斌;郑鸿;王华;汪倩;刘少君;胡建;陈杰;樊智坤 | 申请(专利权)人: | 南方电网互联网服务有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/31;G06F16/335 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 胡雪 |
地址: | 510030 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象 推荐 方法 装置 计算机 设备 | ||
本申请实施例提供了一种对象推荐方法,其特征在于,方法,包括:获取针对于待推荐对象的搜索文本;对搜索文本进行切分,得到搜索文本对应的文本字符;在预先构建的数组中对文本字符进行前缀索引,得到文本字符对应的第一匹配结果;根据第一匹配结果,在预先构建的双数组Trie树中对文本字符进行最大匹配,得到搜索文本的文本分词;利用文本分词,从推荐对象数据库中,获取与文本分词相匹配的待推荐对象。在本申请实施例提供的该方法中,将原本双数组Trie树中的一部分数据,例如单子节点树结构,存储在数组中,从而,避免形成一个庞大的树干,消耗服务器的内存,解决了消耗内存大的问题。
技术领域
本申请涉及信息搜索领域,特别是涉及一种对象推荐方法、装置和计算机设备。
背景技术
用户在购物平台进行采购时,通常会‘货比三家’,通过比较多个同类商品,最终选择合适的商品下单。由于购物平台存在海量商品数据,而人工筛选同类商品的效率低下,因此目前通常采用智能推荐技术进行同类商品的筛选和推荐,实现系统快速帮用户筛选同类商品,使采购参考数据更加全面,整体采购效率进一步提升。
对于智能推荐技术,“分词”一直是一项十分重要且基础的步骤。分词就是将句子、段落、文章这种长文本,分解为以字词为单位的数据结构,方便后续的处理分析工作。在现有的分词技术中,多采用双数组Trie树算法对搜索文本进行分词,然而,现有的双数组Trie树,由于如果一个词与其他词的前缀不一样,会展开一个新的树干去存储,所以会形成一个庞大的树干,消耗服务器的内存。因此,存在消耗内存大的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种优化内存占用的对象推荐方法、装置和计算机设备。
第一方面,本申请提供了一种对象推荐方法。所述方法包括:
获取针对于待推荐对象的搜索文本;
对所述搜索文本进行切分,得到所述搜索文本对应的文本字符;
在预先构建的数组中对所述文本字符进行前缀索引,得到所述文本字符对应的第一匹配结果;所述数组包括单子节点树结构;
根据所述第一匹配结果,在预先构建的双数组Trie树中对所述文本字符进行最大匹配,得到所述搜索文本的文本分词;所述双数组Trie树包括多子节点树结构;
利用所述文本分词,从推荐对象数据库中,获取与所述文本分词相匹配的待推荐对象。
在其中一个实施例中,在预先构建的数组中对所述文本字符进行前缀索引,得到所述文本字符对应的第一匹配结果,包括:将所述文本字符中的第一个字符和第二个字符进行组合,得到第一词条;在所述数组中匹配所述第一词条;在匹配成功的情况下,确定所述第一匹配结果为所述数组包括所述第一词条;在匹配失败的情况下,确定所述第一匹配结果为所述数组不包括所述第一词条。
在其中一个实施例中,根据所述第一匹配结果,在预先构建的双数组Trie树中对所述文本字符进行最大匹配,得到所述搜索文本的文本分词,包括:在所述第一匹配结果为所述数组包括所述第一词条的情况下,将所述第一词条的最后一个字符作为当前字符;获取所述文本字符中的所述当前字符的下一个字符,由所述第一词条和所述下一个字符组合得到第二词条;并将所述第二词条作为当前词条;在所述双数组Trie树中查询所述当前词条,得到与所述当前词条对应的当前匹配结果;在所述当前匹配结果为所述双数组Trie树不包括所述当前词条且所述当前词条不是所述双数组Trie树中的词的前缀的情况下,将所述当前词条作为所述文本分词中的一个分词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方电网互联网服务有限公司,未经南方电网互联网服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211510311.3/2.html,转载请声明来源钻瓜专利网。