[发明专利]数据写入方法及设备在审
申请号: | 201711195546.7 | 申请日: | 2017-11-24 |
公开(公告)号: | CN110019210A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 周正中 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/28 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 陈贞健;邵栋 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 归类 数据块 写入 节约资源 数据对应 数据集中 用户查询 组数据 预设 存储 场景 申请 | ||
本申请提供了一种数据写入方案,该方案在接收到待写入的数据之后,对所述数据进行归类,确定归类结果,然后根据所述数据的归类结果,确定所述数据对应的数据块,最终将所述数据写入至对应的数据块中。由于在将数据写入至数据块之前,对数据进行了归类,因此预设的数据块(例如某个或者某组数据块)中都会存储属于某一归类结果的数据,而归类的策略可以根据实际使用的场景进行设定,使得归类结果与用户查询数据的需求相适应,由此在读取数据时,需要的数据集中会分布在数量较少的数据块中,从而提高效率,节约资源。
技术领域
本申请涉及信息技术领域,尤其涉及一种数据写入方法及设备。
背景技术
在分布式存储的场景中,数据在达到数据库时会被随机写入到各个数据块中。例如,有1万个传感器,每个传感器每秒上传1条数据,因为每秒都有1万条数据写入数据库,每条数据在达到数据库时会被随机写入到各个数据块中,由于数据写入是乱序的,因此每秒的1万条数据会散落到各个不同的数据块中。
在读取数据时的处理过程如图1所示,若需要读取的n条数据100分布在数据块1~n中,那么需要将这所有的n个数据块读取至共享内存区,然后从共享内存区的数据块中需要的n条数据。在此过程中,需要将这n个数据块中的所有内容读入共享内存区,然后检索出其中需要的n条数据。
例如,若需要查询某一秒内10个传感器的数据,很有可能这10条数据会写入到10个不同数据块中,因此读取这10条数据时,需要将这10个数据块的所有内容读入共享内存区,然后在其中检索需要的1条数据。由于每个数据块中还包含其它无关的数据,因此目前的数据写入方式会导致读取数据时效率较低,浪费资源。
申请内容
本申请的一个目的是提供一种数据写入的方案,用以解决现有技术中的数据写入方式会导致读取数据时效率较低,浪费资源的问题。
为实现上述目的,本申请提供了一种数据写入方法,该设备包括:
接收待写入的数据,基于所述数据的内容对所述数据进行归类,确定归类结果;
根据所述数据的归类结果,确定所述数据对应的数据块;
将所述数据写入至对应的数据块。
进一步地,接收待写入的数据,对所述数据进行归类,确定归类结果,包括:
接收待写入的数据,将所述数据写入缓冲存储区;
在满足触发条件时,读取所述缓冲存储区的数据,并对所述数据进行归类,确定归类结果。
进一步地,对所述数据进行归类,确定归类结果,包括:
基于所述数据的内容对所述数据进行归类,确定归类结果。
进一步地,基于所述数据的内容对所述数据进行归类,确定归类结果,包括:
基于所述数据的至少一个字段的内容对所述数据进行归类,确定归类结果。
进一步地,基于所述数据的至少一个字段的内容对所述数据进行归类,确定归类结果,包括:
基于所述数据的至少一个字段的内容计算所述数据的归类值;
根据所述归类值和数据的归类数量,确定归类结果。
进一步地,根据所述数据的归类结果,确定所述数据对应的数据块,包括:
根据所述数据的归类结果,选取该数据的归类结果对应的一个待写入数据块;
判断所述待写入数据块的数据量是否达到阈值,若为是,重新选取所述归类结果对应的另一待写入数据块;
若为否,将选取的待写入数据块确定为所述数据对应的数据块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711195546.7/2.html,转载请声明来源钻瓜专利网。