[发明专利]一种基于增量学习的海洋观测大数据分布方法有效

专利信息
申请号: 201710117922.4 申请日: 2017-03-01
公开(公告)号: CN106897705B 公开(公告)日: 2020-04-10
发明(设计)人: 黄冬梅;贺琪;随宏运;何盛琪;石少华 申请(专利权)人: 上海海洋大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 上海卓阳知识产权代理事务所(普通合伙) 31262 代理人: 周春洪
地址: 201306 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 增量 学习 海洋 观测 数据 分布 方法
【权利要求书】:

1.一种基于增量学习的海洋观测大数据分布方法,其特征在于,所述分布方法包括以下步骤:

S1:输入待布局的增量海洋观测数据集;

S2:初始化存储容量;

S3:计算增量数据集中数据的数据价值;

S4:对增量数据集中的所有数据进行划分;

S5:利用增量学习方法对增量数据集进行训练;

S6:对训练后的数据进行布局;

S7:输出布局后的增量海洋观测数据集;

其中,所述的步骤S5中的增量学习方法为支持向量机增量学习方法。

2.根据权利要求1所述的分布方法,其特征在于,所述的步骤S3中的数据价值计算包括计算时效性、计算关联性、计算地域性。

3.根据权利要求1所述的分布方法,其特征在于,所述的步骤S4中的划分为利用k-means方法对数据集中的所有数据进行初始划分,将数据集分为活跃区和非活跃区。

4.根据权利要求1所述的分布方法,其特征在于,所述的步骤S6中的布局为对训练后的数据按照活跃区和非活跃区进行布局。

5.根据权利要求2所述的分布方法,其特征在于,所述的步骤S3的计算方法包括以下步骤:

S31:计算时效性

利用TF-IDF加权技术计算海洋观测大数据的时效性,其计算公式为如下:

<mrow><msub><mi>W</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>d</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mi>ft</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>d</mi><mo>)</mo></mrow><mo>&times;</mo><mi>log</mi><mrow><mo>(</mo><mfrac><mi>N</mi><msub><mi>n</mi><mi>i</mi></msub></mfrac><mo>+</mo><mn>0.01</mn><mo>)</mo></mrow></mrow><msqrt><mrow><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msup><mrow><mo>(</mo><msub><mi>tf</mi><mi>i</mi></msub><mo>(</mo><mi>d</mi><mo>)</mo><mo>)</mo></mrow><mn>2</mn></msup><mo>&times;</mo><msup><mrow><mo>&lsqb;</mo><mi>log</mi><mrow><mo>(</mo><mfrac><mi>N</mi><msub><mi>n</mi><mi>i</mi></msub></mfrac><mo>+</mo><mn>0.01</mn><mo>)</mo></mrow><mo>&rsqb;</mo></mrow><mn>2</mn></msup></mrow></msqrt></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>

其中,N为海洋观测大数据集的总数据量,ni表示包含观测数据属性项d的数据集数,tfi(d)表示观测数据属性项d在数据集中出现的频率,Wi(d)表示属性项d的权值。

S32:计算关联性

设分别表示应用观测数据dk和dm的观测任务,则观测数据dk和dm之间的关联度Sij的计算公式如下:

<mrow><msub><mi>S</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>=</mo><mi>c</mi><mi>o</mi><mi>u</mi><mi>n</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>T</mi><msub><mi>d</mi><mi>k</mi></msub></msub><mo>&cap;</mo><msub><mi>T</mi><msub><mi>d</mi><mi>m</mi></msub></msub><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>

S33:计算地域性

利用欧式距离计算方法计算各观测区内各观测位置间的距离Lmn,其计算公式如下:

Lmn=√(xm-xn)2+(ym-yn)2 (3)

其中Lmn表示观测点m和观测点n之间的距离,xm和xn分别表示观测点m和观测点n的经度值,ym和yn分别表示观测点m和观测点n的纬度值。

引入归一化变量,用相对位置和整个区间内距离最大值的比值作为观测点的距离关联值RLmn,其计算公式如下:

<mrow><msub><mi>RL</mi><mrow><mi>m</mi><mi>n</mi></mrow></msub><mo>=</mo><mfrac><msub><mi>L</mi><mrow><mi>m</mi><mi>n</mi></mrow></msub><mrow><mi>m</mi><mi>a</mi><mi>x</mi><mo>{</mo><msub><mi>L</mi><mn>12</mn></msub><mo>,</mo><msub><mi>L</mi><mn>13</mn></msub><mo>,</mo><msub><mi>L</mi><mn>14</mn></msub><mo>...</mo><msub><mi>L</mi><mrow><mi>m</mi><mi>n</mi></mrow></msub><mo>}</mo></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>

其中,RLmn表示观测点m和观测点n之间的距离关联值,max{L12,L13,L14,……,Lmn}表示在每个距离值之间取最大值。

S34:计算数据价值

对于海洋观测大数据,根据其被使用的频度、数据的下载次数、数据使用者的重要程度和数据产品的生产成本等因素,适当选取每项因素的加权银子,计算数据价值,其计算公式如下:

Vi(d)=Wi(d)×k1+Si(d)×k2+RLi(d)×k3+C(5)

其中,Vi(d)代表观测数据的数据价值,Wi(d)代表观测数据的时效性,Si(d)代表观测数据的关联性,RLi(d)带包观测数据的地域性,k1为Wi(d)的加权因子,k2为Si(d)的加权因子,k3为RLi(d)的加权因子,C代表数据价值的惩罚因子,由观测数据的用户关注度、数据采集完成所经历的时间、参与的人力以及数据生产所经历的环节综合得出。

6.根据权利要求1所述的分布方法,其特征在于,所述的步骤S5的工作流程如下:

S51:输入新增海洋大数据样本集Bi(i=1,2,3,……,n);

S52:判断新增样本是否符合KKT条件:

S521:若符合KKT条件,根据KKT条件进行支持向量机(SVM)分类,然后进入步骤S56;

S522:若不符合KKT条件,则进入步骤S53;

S53:判断Bi是否都在分类面上:

S531:若Bi都在分类面上,则将其归为分类间隔上的样本,然后进入步骤S56;

S532:若Bi不都在分类面上,则进入步骤S54;

S54:判断Bi是否都在分类面的边缘或原分类有误:

S541:若Bi都在分类面的边缘或原分类有误,则将其归为分类间隔内的样本,然后进入步骤S56;

S542:若Bi不都在分类面的边缘或原分类无误,则进入步骤S55;

S55:根据数据价值训练样本集,即利用k-means方法划分样本集;

S56:输出增量样本集。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海洋大学,未经上海海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710117922.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top