[发明专利]区块链内外多源异构数据基于广度学习算法的融合方法有效

专利信息
申请号: 201810357191.5 申请日: 2018-04-20
公开(公告)号: CN108549709B 公开(公告)日: 2019-02-22
发明(设计)人: 郑相涵;翟宇波 申请(专利权)人: 福州大学
主分类号: G06F16/27 分类号: G06F16/27;G06F16/242;G06N3/04;G06N3/08
代理公司: 福州元创专利商标代理有限公司 35100 代理人: 蔡学俊
地址: 350108 福建省福*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据源 区块 多源异构数据 学习算法 融合 异质数据源 关联数据 信息融合 应用机器 知识融合 挖掘 学习
【权利要求书】:

1.一种区块链内外多源异构数据基于广度学习算法的融合方法,其特征在于:

步骤S1:将多种类型的数据包括用户视角的数据和行为视角的数据,映射到高维非线性的潜在空间中的多源数据;

步骤S2:使用词嵌入技术将多源数据转化为低维空间中的向量,得到多源数据简单的,初步的分布式表示Xp和Xu,Xp和Xu分别为行为视角的数据分布式表示和用户视角的数据分布式表示,将其作为卷积神经网络模型的输入;

步骤S3:将Xp和Xu通过卷积神经网络模型进行卷积操作,得到卷积操作提取的用户视角抽象特征cu和行为视角抽象特征cp

步骤S4:对于行为视角抽象特征cp,继续作为LSTM模块的输入,可以得到LSTM模块的最后时刻隐藏层输出ht,并将最后时刻隐藏的输出ht作为行为视角的最终特征;

步骤S5:通过趋势预测层联合优化用户视角抽象特征cu和行为视角的最终特征ht,并预设整个模型架构的最小化误差值,且误差值公式为:

其中nsamples表示n个样本,nlabels表示n个标签,是数据的真实趋势,Lij={(k,l):fik<fij,yik=1,yil=0},Lij表示第i个样本对应第j个标签的预测误差值,其中(k,l)是行向量,表示第k个预测标签与第l个实际标签的误差值;fik<fij表示第i个样本对应的第k个标签的预测值小于第i个样本对应的第j个标签的预测值,即表示预测错误;yik表示第i个样本对应的第k个标签的真实值,yil表示第i个样本对应的第l个标签的真实值;是分类器的预测趋势,若ranking(y,f)小于预设的最小化误差值,则说明本模型得到的分类器的预测趋势满足预设的数据趋势预测的要求。

2.根据权利要求1所述的一种区块链内外多源异构数据基于广度学习算法的融合方法,其特征在于:所述步骤S2使用词嵌入技术将多源数据转化为低维空间中的向量,具体为:

假定向量维度为d,行为视角的评论句子的长度为lp,用户视角的评论句子的长度为lu,则行为视角的数据分布式表示为:

用户视角的数据分布式表示为:

且其中,R表示向量空间,和分别是Xp和Xu的第i个位置的词向量。

3.根据权利要求2所述的一种区块链内外多源异构数据基于广度学习算法的融合方法,其特征在于:所述卷积操作得到用户视角抽象特征cu具体包括:

假定数据分布表达式中的第i到j个词向量拼接为

对拼接的词向量xij进行卷积操作,公式为:

得到对应数据分布表达式的抽象特征:

其中,h为卷积核的长度,W∈Rh*d为卷积核的权重矩阵,L为一条评论的长度,b∈Rd为偏置项。

4.根据权利要求2所述的一种区块链内外多源异构数据基于广度学习算法的融合方法,其特征在于:所述卷积操作得到行为视角抽象特征cp具体包括:

假定数据分布表达式中的第i到j个词向量拼接为

对拼接的词向量xij进行卷积操作,公式为:

得到对应数据分布表达式的抽象特征:

其中,h为卷积核的长度,W∈Rh*d为卷积核的权重矩阵,L为一条评论的长度,b∈Rd为偏置项。

5.根据权利要求1所述的一种区块链内外多源异构数据基于广度学习算法的融合方法,其特征在于:所述步骤S4具体为:

LSTM能学习到文本的语义序列特征,这是因为它以指定的周期循环地执行cell块,每个cell块依赖于前一个时刻隐藏层的输出ht-1和当前时刻的输入xt;每个cell块包含三个门限:遗忘门ft,输入门it,输出门ot,其公式分别为:

it=δ(Wf·[ht-1,xt]+bf) (6)

ft=δ(Wi·[ht-1,xt]+bi) (7)

ot=δ(Wo·[ht-1,xt]+bo) (8)

其中δ表示激活函数,Wf,Wi,Wo分别是遗忘门ft,输入门it,输出门ot的权重参数,bf,bi,bo分别是遗忘门,输入门,输出门的偏置项;WC为候选值向量的权重参数;bC为候选值向量的偏置项;

根据遗忘门ft,输入门it,可以得到当前时刻遗忘门的临时状态Ct为:

Ct和Ct-1分别为当前时刻和上一时刻遗忘门的临时状态

根据当前时刻遗忘门的临时状态Ct,可以得到LSTM模块的最后时刻隐藏层输出ht为:

ht=ot*tanh(Ct) (11)

并将最后时刻隐藏的输出ht作为行为视角的最终特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810357191.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top