[发明专利]一种存储大数据的方法、装置、设备及存储介质在审
| 申请号: | 201810358724.1 | 申请日: | 2018-04-20 |
| 公开(公告)号: | CN108549711A | 公开(公告)日: | 2018-09-18 |
| 发明(设计)人: | 许洪腾;袁瑞康;钟灵;黄永慧 | 申请(专利权)人: | 广东工业大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
| 地址: | 510060 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 标识信息 数据库 存储 大数据 链接关系 文件数据 计算机可读存储介质 标识信息存储 采集数据 存储规则 存储介质 存储数据 数据采集 数据设置 提取数据 减小 预设 申请 采集 查询 | ||
1.一种存储大数据的方法,其特征在于,包括:
根据数据采集请求采集数据;
将所述数据按照预设的存储规则存储至文件数据集中并分别为所述数据设置标识信息;
将所述标识信息存储于数据库中;
建立所述数据和所述数据库中的所述标识信息的链接关系。
2.根据权利要求1所述的方法,其特征在于,在所述将所述数据按照预设的存储规则存储至文件数据集中并分别为所述数据设置标识信息之后,进一步包括:
提取所述数据的关键词信息;
对应的,所述将所述标识信息存储于数据库中;建立所述数据和所述数据库中的所述标识信息的链接关系具体为:
将所述标识信息和对应数据的关键词信息存储于数据库中;
建立所述数据和所述数据库中的所述标识信息与所述关键词信息的链接关系。
3.根据权利要求1所述的方法,其特征在于,在所述根据数据采集请求采集数据之后,进一步包括:
根据实际要求对所述数据进行校验,并删除不符合所述实际要求的数据离群点。
4.根据权利要求1所述的方法,其特征在于,在所述根据数据采集请求采集数据之后,进一步包括:
按照预设格式对所述数据进行格式转换。
5.根据权利要求1所述的方法,其特征在于,在所述将所述数据按照预设的存储规则存储至文件数据集中并分别为所述数据设置标识信息之前,进一步包括:
对所述数据进行数据组合和/或数据清洗和/或数据校验。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述数据采集请求具体为根据实际数据采集对象、实际数据分析需求、实际数据存储需要和实际数据产生规模分析得出。
7.根据权利要求6所述的方法,其特征在于,所述数据采集请求具体为根据预先设置的时间周期得出。
8.一种存储大数据的装置,其特征在于,包括:
数据采集模块,用于根据数据采集请求采集数据;
第一存储模块,用于将所述数据按照预设的存储规则存储至文件数据集中并分别为所述数据设置标识信息;
第二存储模块,用于将所述标识信息存储于数据库中;
建立链接模块,用于建立所述数据和所述数据库中的所述标识信息的链接关系。
9.一种存储大数据的设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的存储大数据的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的存储大数据的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810358724.1/1.html,转载请声明来源钻瓜专利网。





