[发明专利]一种热点关键字获取方法、装置及服务器在审
申请号: | 201710865548.6 | 申请日: | 2017-09-22 |
公开(公告)号: | CN109542612A | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 刘欢;朱国云;陈梁;钱龙 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 陈蕾 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 访问 次数区间 链表 关键字获取 服务器 读取 分布式系统 负载均衡 数据请求 统计周期 整体处理 高效性 从链 申请 查询 更新 | ||
本申请提供一种热点关键字获取方法、装置及服务器,该方法包括:在统计周期内,获取关键字,并获取所述关键字的访问次数;确定所述访问次数所在的访问次数区间,查询出与所述访问次数区间对应的链表;不同的访问次数区间对应不同的链表;更新所述关键字的访问次数在所述链表中的位置;在需要确定热点关键字时,从链表中读取关键字的访问次数,根据关键字的访问次数确定热点关键字。通过本申请的技术方案,可以实现分布式系统的负载均衡,提高系统的稳定性和高效性,提升对热点关键字的数据请求的整体处理能力。
技术领域
本申请涉及互联网领域,尤其是一种热点关键字获取方法、装置及服务器。
背景技术
分布式系统是应对当下大数据存储需求的主流方案之一,在分布式系统中,可以部署多个数据库服务器,各数据库服务器用于存储相同的数据。应用服务器在接收到客户端发送的数据请求后,采用hash算法确定数据库服务器,并向该数据库服务器发送数据请求。数据库服务器在接收到数据请求后,将与该数据请求对应的数据返回给应用服务器,以使应用服务器将该数据返回给客户端。
由于hash算法是固定的,因此,用于获取同一数据的数据请求会被定位到同一数据库服务器,从而导致无法实现负载均衡,分布式系统的稳定性较差。
例如,应用服务器对数据标识进行hash处理,并根据处理结果确定数据库服务器,针对数据标识A的所有数据请求,被定位到数据库服务器A,针对数据标识B的所有数据请求,被定位到数据库服务器B。若数据标识A的数据请求数量远大于数据标识B的数据请求数量,则数据库服务器A的处理压力较大,数据库服务器B的处理压力较小,无法在数据库服务器之间实现负载均衡。
发明内容
本申请提供一种热点关键字获取方法,应用于数据库服务器,包括:
在统计周期内,获取关键字,并获取所述关键字的访问次数;
确定所述访问次数所在的访问次数区间,并查询出与所述访问次数区间对应的链表;其中,不同的访问次数区间对应不同的链表;
更新所述关键字的访问次数在所述链表中的位置;
在需要确定热点关键字时,从链表中读取关键字的访问次数,并根据关键字的访问次数确定热点关键字。
本申请提供一种热点关键字获取方法,应用于数据库服务器,包括:
在统计周期内,获取关键字,通过所述关键字查询哈希表,得到与所述关键字对应的数据块位置;所述哈希表用于记录关键字与数据块位置的对应关系;
从所述数据块位置对应的数据块中查询出访问次数,利用查询出的访问次数获得所述关键字的访问次数,将所述关键字的访问次数更新到所述数据块中;
在需要确定热点关键字时,从链表中读取关键字的访问次数,并根据关键字的访问次数确定热点关键字。
本申请提供一种热点关键字获取方法,应用于数据库服务器,包括:
在统计周期内,获取关键字,并获取所述关键字的访问次数;
确定所述访问次数所在的访问次数区间,并查询出与所述访问次数区间对应的链表;其中,不同的访问次数区间对应不同的链表;
更新所述关键字的访问次数在所述链表中的位置;
在需要删除数据块中的内容时,根据访问次数区间与链表的对应关系,查询出优先级最低的链表,并将所述优先级最低的链表的最后一个数据块中的内容删除;其中,优先级最低的链表是最小的访问次数区间对应的链表;
在需要确定热点关键字时,从链表中读取关键字的访问次数,并根据关键字的访问次数确定热点关键字。
本申请提供一种热点关键字获取装置,应用于数据库服务器,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710865548.6/2.html,转载请声明来源钻瓜专利网。