[发明专利]一种基于大数据的对象搜索方法、装置和计算机设备在审
申请号: | 202111445849.6 | 申请日: | 2021-11-30 |
公开(公告)号: | CN114218449A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 马林;刘威;胡天宝;胡蝶颖 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F40/289 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 王天庆 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 对象 搜索 方法 装置 计算机 设备 | ||
本公开实施例涉及一种基于大数据的对象搜索方法、装置和计算机设备。所述方法包括:获取与搜索词相匹配的多个对象及所述对象的多个维度的名称;按照所述搜索词中第一分词出现的前后顺序,从所述多个维度的名称的第二分词中依次匹配所述第一分词,得到多个分词路径;根据分词路径中的第二分词的维度权重以及所述第二分词与下一个第二分词的关系权重,确定所述多个分词路径中每个分词路径的总权重;将最大的总权重作为所述对象与所述搜索词的相关性,从所述多个对象中确定相关性最大的对象作为目标对象。采用本方法能够综合考虑到搜索词的分词出现在产品的不同位置不同维度的情况,从而提高了搜索的准确性及搜索质量。
技术领域
本公开实施例涉及大数据数据访问技术领域,特别是涉及一种基于大数据的对象搜索方法、装置和计算机设备。
背景技术
与通用的网页搜索引擎相比,电子产品搜索具有以下特点:第一,产品标题相对网页标题较短;第二,产品可搜索维度较多,包括产品标题、产品品牌、产品类目、产品属性等;第三,产品数量一般比网页数量少。针对以上特点,通用的网页搜索引擎的搜索方法并不适应于电子产品的搜索。
现有的电子产品搜索方法主要包括:建立搜索引擎索引库,搜索引擎对用户输入的关键词分词,将分词结果到索引库中进行查找,然后将查找到的包含该分词的多个产品集合做交集,得到搜索产品的集合。然而,现有的搜索流程中,得到的搜索结果的相关性仅考虑索引库中是否包含分词,使得搜索的准确性降低,导致搜索质量不高。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高搜索准确性和搜索质量的搜索方法、装置和计算机设备。
第一方面,本公开实施例提供了一种基于大数据的对象搜索方法。所述方法包括:
获取与搜索词相匹配的多个对象及所述对象的多个维度的名称;
按照所述搜索词中第一分词出现的前后顺序,从所述多个维度的名称的第二分词中依次匹配所述第一分词,得到多个分词路径;
根据分词路径中的第二分词的维度权重以及所述第二分词与下一个第二分词的关系权重,确定所述多个分词路径中每个分词路径的总权重;
将最大的总权重作为所述对象与所述搜索词的相关性,从所述多个对象中确定相关性最大的对象作为目标对象。
在其中一个实施例中,所述获取与搜索词相匹配的多个对象及所述对象的多个维度的名称,包括:
获取搜索词的多个第一分词;
获取对象的多个维度的名称,若所述名称中存在多个第二分词与所述多个第一分词相匹配,则所述对象为与所述搜索词相匹配的多个对象之一。
在其中一个实施例中,所述多个维度的名称包括下述中的至少一种:
标题名称、类目名称、标识名称。
在其中一个实施例中,所述根据分词路径中的第二分词的维度权重以及所述第二分词与下一个第二分词的关系权重,确定所述多个分词路径中每个分词路径的总权重,包括:
获取分词路径中的第二分词的维度权重以及所述第二分词与下一个第二分词的关系权重,其中,所述维度权重为根据维度的类型设置得到;
分别确定同一分词路径中的第二分词的维度权重与关系权重的乘积作为所述分词路径的总权重。
在其中一个实施例中,所述第二分词与下一个第二分词的关系权重的获得方式,包括:
若所述第二分词的下一个第二分词与所述第二分词位于同一个维度,则所述第二分词与所述下一个第二分词的关系权重被确定为预设的连接权重。
在其中一个实施例中,所述第二分词与下一个第二分词的关系权重的获得方式,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111445849.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种碳纤维杆件铺层设计优化方法
- 下一篇:一种对转冲压压气机
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置