[发明专利]数据写入方法及设备在审

申请号：	201711195546.7	申请日：	2017-11-24
公开（公告）号：	CN110019210A	公开（公告）日：	2019-07-16
发明（设计）人：	周正中	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G06F16/22	分类号：	G06F16/22;G06F16/28
代理公司：	上海百一领御专利代理事务所(普通合伙) 31243	代理人：	陈贞健;邵栋
地址：	英属开曼群岛大开***	国省代码：	开曼群岛;KY
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	归类数据块写入节约资源数据对应数据集中用户查询组数据预设存储场景申请
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供了一种数据写入方案，该方案在接收到待写入的数据之后，对所述数据进行归类，确定归类结果，然后根据所述数据的归类结果，确定所述数据对应的数据块，最终将所述数据写入至对应的数据块中。由于在将数据写入至数据块之前，对数据进行了归类，因此预设的数据块(例如某个或者某组数据块)中都会存储属于某一归类结果的数据，而归类的策略可以根据实际使用的场景进行设定，使得归类结果与用户查询数据的需求相适应，由此在读取数据时，需要的数据集中会分布在数量较少的数据块中，从而提高效率，节约资源。

技术领域

本申请涉及信息技术领域，尤其涉及一种数据写入方法及设备。

背景技术

在分布式存储的场景中，数据在达到数据库时会被随机写入到各个数据块中。例如，有1万个传感器，每个传感器每秒上传1条数据，因为每秒都有1万条数据写入数据库，每条数据在达到数据库时会被随机写入到各个数据块中，由于数据写入是乱序的，因此每秒的1万条数据会散落到各个不同的数据块中。

在读取数据时的处理过程如图1所示，若需要读取的n条数据100分布在数据块1～n中，那么需要将这所有的n个数据块读取至共享内存区，然后从共享内存区的数据块中需要的n条数据。在此过程中，需要将这n个数据块中的所有内容读入共享内存区，然后检索出其中需要的n条数据。

例如，若需要查询某一秒内10个传感器的数据，很有可能这10条数据会写入到10个不同数据块中，因此读取这10条数据时，需要将这10个数据块的所有内容读入共享内存区，然后在其中检索需要的1条数据。由于每个数据块中还包含其它无关的数据，因此目前的数据写入方式会导致读取数据时效率较低，浪费资源。

申请内容

本申请的一个目的是提供一种数据写入的方案，用以解决现有技术中的数据写入方式会导致读取数据时效率较低，浪费资源的问题。

为实现上述目的，本申请提供了一种数据写入方法，该设备包括：

接收待写入的数据，基于所述数据的内容对所述数据进行归类，确定归类结果；

根据所述数据的归类结果，确定所述数据对应的数据块；

将所述数据写入至对应的数据块。