[发明专利]一种大数据量的趋势曲线绘制方法有效
申请号: | 201210138939.5 | 申请日: | 2012-05-07 |
公开(公告)号: | CN102693361A | 公开(公告)日: | 2012-09-26 |
发明(设计)人: | 李睿;吕江花;马世龙 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06F17/30 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 周长琪 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种大数据量的趋势曲线绘制方法,用于计算机数据统计分析。该方法首先确定取样间隔,将时间段等分,然后确定特征值,首先对时间段的采样值进行预处理,忽略一些值,然后在时间段中选取三个质心K1、K2和K3,对保留下的值进行聚类,将每个值归类到离它最近的那个质点所代表的聚类中,聚类完成后,将K2和K3的聚类中的第一个值及最后一个值取作特征值,并对K2和K3的聚类中剩余值进行筛选,得到特征值;最后,确定特征值个数,利用贝塞尔曲线逼近算法,绘制曲线。本发明采样最少采样值绘制了最为逼近的曲线,不用一次查询所有的数据,不用一次将所有数据读入内存,大大节省系统开销,实现了大数据量的快速绘制。 | ||
搜索关键词: | 一种 数据量 趋势 曲线 绘制 方法 | ||
【主权项】:
一种大数据量的趋势曲线绘制方法,其特征在于,具体包括如下步骤:步骤1:获取用户指定的曲线绘制时间区间T,将T等分成N个时间段[Ti,Ti+1],i=0…N‑1;步骤2:构造查询SQL语句,从数据库中获取第一个时间段的首个采样值D0以及每个时间段[Ti,Ti+1]的最后一个采样值Di+1,i=0…N‑1;步骤3:构造查询SQL语句,从数据库中获取时间段[Ti,Ti+1]中所有采样值的数据,将数据读入内存后,转入步骤4执行;初始i=0;步骤4:对读入内存的数据作预处理,具体是:针对每一个采样值,确定该采样值减去其前一个采样值的差值,以及该采样值减去其后一个采样值的差值,判断两个差值是否同为正数或者负数,若是,则保留该采样值,否则舍弃该采样值;步骤5:在当前获取的时间段[Ti,Ti+1]中选取三个质心K1、K2和K3:K1=(Di+Di+1)/2;K2=((Di+Di+1)+((Di+1‑Di)2+(Ti+1‑Ti)2)1/2)/2;K3=((Di+Di+1)‑((Di+1‑Di)2+(Ti+1‑Ti)2)1/2)/2Di为时间段[Ti,Ti+1]的第一个采样值,Di+1为时间段[Ti,Ti+1]的最后一个采样值;步骤6:对时间段[Ti,Ti+1]中保留的每个采样值,计算采样值到每个质心的距离,将每个采样值归类到离它最近的质心所代表的聚类中;步骤7:聚类完成后,在以K2和K3为质心的两个聚类中,取第一个采样值及最后一个采样值为特征值;步骤8:对以K2和K3为质心的两个聚类中的数据进一步筛选,具体是:针对每个聚类中的每个非特征值的采样值,判断该采样值Sj与其前一个采样值Sj‑1作差的绝对值|Sj‑Sj‑1|,或者采样值Sj与其后一个样本值Sj+1作差的绝对值|Sj‑Sj+1|,是否大于或等于阀值A,若是,则取该采样值Sj为特征值,否则,舍弃该采样值Sj;步骤9:记录当前时间段[Ti,Ti+1]在步骤7和步骤8中所取得的特征值,并统计特征值的总个数Ci;步骤10:根据时间段[Ti,Ti+1]中的第一个样本值Di、最后一个样本值Di+1以及Ci个特征值,共Ci+2个样本值,构造Ci+1次贝塞尔曲线B(t),曲线绘制后,清除内存中时间段[Ti,Ti+1]的数据,然后i递增加1,判断i是否等于N,若否,转步骤3执行,若是,结束本方法。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210138939.5/,转载请声明来源钻瓜专利网。
- 上一篇:内燃机的可变气门装置
- 下一篇:重组蛋白混合物介导的牛结核病诊断方法及其试剂
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用