[发明专利]一种基于K-means的能耗感知的数据分类方法在审
申请号: | 201811403709.0 | 申请日: | 2018-11-23 |
公开(公告)号: | CN109558905A | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 游新冬;吕学强;董志安 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 存储区域 季节性 能耗 聚类 潮汐 数据分类 感知 存储 磁盘转速 存储系统 时间阶段 数据存储 数据分布 数据构建 数据指定 提取数据 性能模式 时间段 降耗 数组 算法 访问 挖掘 | ||
本发明涉及一种基于K‑means的能耗感知的数据分类方法,包括:首先从存储系统中提取指定数据指定时间段中每一天的访问频次,然后针对每一个数据构建相应的季节性特性数组,进而利用K‑means算法对数据进行聚类,设定相应的类别,具有不同季节特性的数据存储在不同的季节性存储区域,而针对不同的季节性存储区域中的数据进一步挖掘其潮汐特性,并将不同潮汐特性的数据分布在不同的存储区域。本发明通过提取数据的潮汐特性和季节性特性,利用K‑means对数据进行聚类存储,将具有相似访问特性的数据进行聚类存储,通过控制磁盘转速的方式,在不同的时间阶段上对不同的存储区域实施不同的能耗和性能模式,达到在季节和周的粒度范畴上的极佳降耗效果,能耗低。
技术领域
本发明属于计算机数据管理技术领域,具体涉及一种基于K-means的能耗感知的数据分类方法。
背景技术
近年来随着互联网数据量的爆发式增长,数据以云存储的方式进行集中管理成为了一种安全,可靠的通用方式,然而由此也带来了另外一个严峻的问题:数据中心消耗着巨大的电力资源,大大提高了数据中心的运营成本的同时还会对环境产生恶劣的影响。云存储系统消耗着数据中心30%~40%的能量,因此如何降低云存储系统中的能耗是一个迫切需要解决的问题。
发明内容
针对上述现有技术中存在的问题,本发明的目的在于提供一种可避免出现上述技术缺陷的基于K-means的能耗感知的数据分类方法。
为了实现上述发明目的,本发明提供的技术方案如下:
一种基于K-means的能耗感知的数据分类方法,包括:提取数据的潮汐特性和季节性特性;利用K-means算法对数据进行聚类存储。
进一步地,所述数据分类方法具体为:首先从存储系统中提取指定数据指定时间段中每一天的访问频次,然后针对每一个数据构建相应的季节性特性数组,进而利用K-means算法对数据进行聚类,设定相应的类别,具有不同季节特性的数据存储在不同的季节性存储区域,而针对不同的季节性存储区域中的数据进一步挖掘其潮汐特性,并将不同潮汐特性的数据分布在不同的存储区域。
进一步地,分类所基于的数据集表示为D={d1,d2,…,dm},数据集的大小为m,m为正整数。
进一步地,数据的潮汐特性表示为
其中cxi=[pi,1 vi,1 pi,2 vi,2 … pi,z vi,z],
其中z为数据所涉及到的周次个数,z为正整数。
进一步地,数据的季节性特性表示为假设采集的是数据y年的季节性特性,每年有四个季节的搜索指数占比维度值,因此每个数据的季节性特性用
Sei=[se1,se2,…,se4*y]表示。
进一步地,在所述数据分类方法中,根据数据的季节性特性的提取算法SCEA针对每一个数据构建相应的季节性特性数组。
进一步地,在所述的分类方法中,提取数据的季节性特性后,利用K-means算法将数据分成5类:冬季、秋季、夏季、春季、其他。
进一步地,在所述的分类方法中,针对不同的数据类别,通过数据的潮汐特性提取算法TCEA,提取数据的潮汐特性,构建一个数组存储数据的潮汐特性。
进一步地,在所述的分类方法中,提取数据的潮汐特性后,利用K-means算法将数据分成3类:与工作相关的数据、与娱乐相关的数据、其他数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811403709.0/2.html,转载请声明来源钻瓜专利网。