[发明专利]查找作品的方法、装置、电子设备及存储介质有效
| 申请号: | 201910864234.3 | 申请日: | 2019-09-12 |
| 公开(公告)号: | CN110598009B | 公开(公告)日: | 2022-04-22 |
| 发明(设计)人: | 袁超 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
| 主分类号: | G06F16/435 | 分类号: | G06F16/435;G06F16/41;G06F16/438 |
| 代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 李欣;丁芸 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 查找 作品 方法 装置 电子设备 存储 介质 | ||
1.一种查找作品的方法,其特征在于,包括:
获取查询请求的关键字对应的作品的作品类型的类型ID以及所述关键字的关键字ID;其中,所述查询请求的关键字对应的作品是用户请求阅读或观看的作品,作品类型根据作品内容所具有的共性进行划分;
按照拼接组合方式,对所述类型ID以及所述关键字ID进行拼接组合,得到所述查询请求的关键字对应的作品的全局ID,其中,所述全局ID是唯一的,表示作品在索引服务中的ID;
依据预先建立的倒排索引,确定包括所述查询请求的关键字对应的作品的全局ID的索引项,所述倒排索引的每一索引项包括一个全局ID以及该全局ID对应作品的存储地址;该全局ID对应的作品为生成该全局ID时使用的类型ID以及关键字ID所对应的作品;
从所确定的索引项包括的存储地址中,获取所述查询请求的关键字对应的作品。
2.根据权利要求1所述的查找作品的方法,其特征在于,所获取的所述查询请求的关键字对应的作品的数量为多个,所述方法还包括:
根据作品属性特征,对所获取的各个所述查询请求的关键字对应的作品进行排序,得到所获取的各个所述查询请求的关键字对应的作品的展示顺序信息;
向客户端发送所获取的各个所述查询请求的关键字对应的作品以及所述展示顺序信息。
3.根据权利要求2所述的查找作品的方法,其特征在于,所述作品属性特征包括作品的预测点击率、作品的点赞率以及作品与关键字的相关度中的一种或多种,所述预测点击率为预估的,作品被点击播放的次数与作品被展现的次数之比,所述点赞率为作品被点赞的次数与作品被点击播放的次数之比。
4.根据权利要求1所述的查找作品的方法,其特征在于,所述按照拼接组合方式,对所述类型ID以及所述关键字ID进行拼接组合,得到所述查询请求的关键字对应的作品的全局ID,包括:
将所述类型ID的尾部与所述关键字ID的首部进行拼接组合,得到包括所述类型ID以及所述关键字ID的所述查询请求的关键字对应的作品的全局ID;或者
将所述关键字ID的尾部与所述类型ID的首部进行拼接组合,得到包括所述类型ID 以及所述关键字ID的所述查询请求的关键字对应的作品的全局ID。
5.一种作品的索引创建方法,其特征在于,包括:
获取待创建索引作品的作品类型的类型ID以及作品关键字的关键字ID;
若未获取到所述作品关键字的关键字ID,生成所述待创建索引作品的作品关键字的关键字ID;其中,所述生成所述待创建索引作品的作品关键字的关键字ID包括:根据所述作品关键字对应的作品的作品类型,生成所述作品类型中所有作品关键字对应的关键字ID之外的ID;
按照拼接组合方式,对所述类型ID以及所述关键字ID进行拼接组合,得到待创建索引作品的全局ID,其中,所述全局ID是唯一的,表示作品在索引服务中的ID;
以所构建的全局ID和所述待创建索引作品的存储地址作为索引项,创建倒排索引。
6.根据权利要求5所述的作品的索引创建方法,其特征在于,所述按照拼接组合方式,对所述类型ID以及所述关键字ID进行拼接组合,得到待创建索引作品的全局ID,包括:
将所述类型ID的尾部与所述关键字ID的首部进行拼接组合,得到包括所述类型ID以及所述关键字ID的待创建索引作品的全局ID;或者
将所述关键字ID的尾部与所述类型ID的首部进行拼接组合,得到包括所述类型ID以及所述关键字ID的待创建索引作品的全局ID。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910864234.3/1.html,转载请声明来源钻瓜专利网。





