[发明专利]应用检索方法、装置、存储介质以及终端在审
| 申请号: | 201711386542.7 | 申请日: | 2017-12-20 |
| 公开(公告)号: | CN108255954A | 公开(公告)日: | 2018-07-06 |
| 发明(设计)人: | 潘岸腾 | 申请(专利权)人: | 广州优视网络科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京市立方律师事务所 11330 | 代理人: | 刘延喜 |
| 地址: | 510640 广东省广州市天河区黄埔大*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 应用 预估 点击率 检索 存储介质 降序排序 预测模型 搜索词 终端 互联网技术 关联关系 特征输入 展示 | ||
本发明提供一种应用检索方法、装置、存储介质以及终端,应用于互联网技术领域,其中方法包括步骤:根据第一用户输入的搜索词获得候选应用集;生成用于表征第一用户输入的搜索词与所述候选应用集中各个应用之间关系的各个第一特征;将所述各个第一特征输入预测模型,得到所述候选应用集中各个应用的预估点击率,其中,所述预测模型用于表征特征与应用的预估点击率之间的关联关系;根据所述预估点击率对所述候选应用集中各个应用进行降序排序,按照降序排序后的顺序将所述候选应用集中各个应用展示给第一用户,本发明实施例能够提高应用检索的效果。
技术领域
本发明涉及互联网技术领域,具体而言,本发明涉及一种应用检索方法、装置、存储介质以及终端。
背景技术
随着技术的发展,各种应用层出不穷,因此在应用商店中会提供一个检索应用的功能,用以用户查找想要的应用。在进行应用检索时,传统技术中的方法一般是通过tf-idf(term frequency–inverse document frequency)算法实现检索功能,但这种方法只是从内容的角度出发检索内容,效果方面很难保障。
发明内容
本发明针对现有方式的缺点,提出一种应用检索方法、装置、存储介质以及终端,用以解决现有技术中存在的应用检索效果较差的问题,以提高应用检索的效果。
本发明的实施例根据第一个方面,提供了一种应用检索方法,包括步骤:
根据第一用户输入的搜索词获得候选应用集;
生成用于表征第一用户输入的搜索词与所述候选应用集中各个应用之间关系的各个第一特征;
将所述各个第一特征输入预测模型,得到所述候选应用集中各个应用的预估点击率,其中,所述预测模型用于表征特征与应用的预估点击率之间的关联关系;
根据所述预估点击率对所述候选应用集中各个应用进行降序排序,按照降序排序后的顺序将所述候选应用集中各个应用展示给第一用户。
在一个实施例中,所述得到所述候选应用集中各个应用的预估点击率之前,还包括:
获取各个第二用户的历史搜索记录,其中,所述历史搜索记录包括输入的搜索词、基于搜索词获得的各个应用以及各个应用是否下载的信息;
生成用于表征各个第二用户输入的搜索词与对应各个应用之间关系的各个第二特征;
将所述各个第二特征输入预设模型进行训练,生成预测模型。
在一个实施例中,所述第二特征包括相关性特征,通过以下步骤生成:
从各个第二用户输入的搜索词中选取一个搜索词作为当前搜索词,从基于所述当前搜索词获得的各个应用中选取一个应用作为当前应用;
对所述当前搜索词进行分词,并计算分词在所述当前搜索词中出现的词频以及逆文档频率,根据词频和逆文档频率获得所述当前搜索词的特征向量;
对所述当前应用的文本信息进行分词,并计算分词在所述文本信息中出现的词频以及逆文档频率,根据词频和逆文档频率获得所述文本信息的特征向量,其中,所述文本信息包括标题和/或描述信息;
将所述当前搜索词的特征向量和所述文本信息的特征向量的夹角的余弦值作为对应的相关性特征;
返回从各个第二用户输入的搜索词中选取一个搜索词作为当前搜索词,从基于所述当前搜索词获得的各个应用中选取一个应用作为当前应用的步骤,直至生成所有的相关性特征。
在一个实施例中,所述历史搜索记录还包括各个应用下载的时间;所述第二特征还包括相关性与热度交叉的特征,通过以下步骤生成:
根据所述相关性特征对基于所述当前搜索词获得的各个应用进行降序排序,获得所述当前应用在所有应用中的相关性排名;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州优视网络科技有限公司,未经广州优视网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711386542.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法和处理装置
- 下一篇:一种数据处理方法及装置





