[发明专利]圈人方法、装置、设备及存储介质在审
申请号: | 202310252213.2 | 申请日: | 2023-03-15 |
公开(公告)号: | CN116303452A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 江凌锋;林小婷;房英明;黄浩然;王清 | 申请(专利权)人: | 携程旅游信息技术(上海)有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/23;G06F16/2453 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 万铁占 |
地址: | 201203 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 方法 装置 设备 存储 介质 | ||
本发明提供了圈人方法、装置、设备及存储介质,通过获取查询请求,查询请求包括至少一个业务标签,使用业务标签查询基于业务标签的用户标识位图,用户标识位图中的每一位数据表示一个用户标识是否具有业务标签,根据查询到的用户标识位图确定用户群。用户标识位图是在业务标签下对所有用户标识进行Bitmap编码得到的,用户标识位图中的每一个Bit位代表一个用户标识并存储该用户标识是否具有对应的业务标签,每个业务标签的单个枚举值只有一行数据,该行数据存储着整个平台海量用户在该业务标签下是否符合的状态。这样,使用Bitmap技术对应海量用户的用户标识只需要很小存储空间,对用户标识位图进行查询,查询效率高。
背景技术
在大数据时代,用户画像尤其重要,用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。
用户画像的核心是为用户打标签,即——将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。
目前采取的做法是基于MapReduce平台,使用用户标识uid(user ID)作为map端输出及reduce端输入的关键字key,根据uid作为key,则同一uid的用户数据可以拼接成一张亿级行数、千级列数的大宽表。分析人员可以根据查询条件拼接SQL,不同查询条件对应宽表的不同字段,最后在大宽表中使用Spark-SQL作为查询引擎来查询目标数据。采用大宽表的形式,可以避免众多查询条件涉及众多不同的表而需要进行几十甚至上百张表的join操作。
其中,如何缩短查询时间是业界所要考虑的课题。
需要说明的是,上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
针对现有技术中的问题,本发明的目的在于提供圈人方法、装置、设备及存储介质,克服了现有技术的困难,能够提升数据查询效率。
本公开实施例提供一种圈人方法,其包括:
获取查询请求,查询请求包括至少一个业务标签;
使用业务标签查询基于业务标签的用户标识位图,用户标识位图中的每一位数据表示一个用户标识是否具有业务标签;
根据查询到的用户标识位图确定用户群。
可选地,在查询请求包括至少两个业务标签及至少两个业务标签之间的布尔逻辑关系的情况下,使用业务标签查询基于业务标签的用户标识位图,包括:
使用每个业务标签查询对应的用户标识位图,得到子用户标识位图;
利用至少两个业务标签之间的布尔逻辑关系对至少两个业务标签对应的子用户标识位图进行逻辑运算,得到目标用户标识位图;
将目标用户标识位图作为查询到的用户标识位图。
可选地,查询请求包括至少两个查询条件组及至少两个查询条件组之间的布尔逻辑关系,每个查询条件组包括至少一个业务标签;
使用业务标签查询基于业务标签的用户标识位图,包括:
对应每个查询条件组中的业务标签,使用业务标签查询基于业务标签的用户标识位图,得到中间用户标识位图;
利用至少两个查询条件组之间的布尔逻辑关系对至少两个中间用户标识位图进行逻辑运算,得到目标用户标识位图;
将目标用户标识位图作为查询到的用户标识位图。
可选地,使用业务标签查询基于业务标签的用户标识位图,包括:
从ClickHouse系统的分区表中查询基于业务标签的用户标识位图,其中,不同分区表里存储不同的用户标识位图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程旅游信息技术(上海)有限公司,未经携程旅游信息技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310252213.2/2.html,转载请声明来源钻瓜专利网。