[发明专利]一种面向金融事件的混合型因果关系发现方法有效
申请号: | 201911193643.1 | 申请日: | 2019-11-28 |
公开(公告)号: | CN111026852B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 林海涛;蔡瑞初 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06Q40/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 金融 事件 混合 因果关系 发现 方法 | ||
1.一种面向金融事件的混合型因果关系发现方法,其特征在于,包括以下步骤:
S1.获取金融事件文本数据集;
S2.从所述金融事件文本数据集中抽取文本事件因果关系;
S3.从所述金融事件文本数据集中提取文本事件的关键词并利用百度指数上转化为随时间动态变化的搜索指数曲线;
S4.运用格兰杰因果性或因果传递熵算法确定两搜索指数曲线对应的文本事件对之间的因果关系;
S5.用最大似然估计方法融合步骤S2和S4分别得到的因果关系,从而生成金融事件因果关系发现;
步骤S4中所述的利用因果传递熵算法确定两搜索指数曲线对应的文本事件对之间的因果关系具体为:
所述传递熵的规则定义如下:
两搜索指数曲线对应的文本事件对A,B的传递熵为TEA→B,k次置换检验的传递熵向量为若满足则A→B的因果关系是显著的;其中α为选定的显著性水平;
因果关系A→B是否显著的检验步骤:
首先定义H0:因果关系A→B不存在;定义H1:因果关系A→B存在;
a.计算统计量TEA→B;
b.随机打乱序列At-1的顺序k次,计算统计量TE′;
c.计算p值:
d.若成立,则拒绝H0;否则接受H0;
根据:
其中I(·;·|·)为条件互信息,δ,l分别是想要检验的A对B的因果延迟和滞后期数量;Con是条件变量集,包括A的自身影响和其他已知的原因变量;shuffle(·)是洗牌函数,负责将序列随机打乱;
若给定Con的条件下,A→B存在因果延迟为δ、滞后期数量为l的因果关系,则信息传递量等于
步骤S5中采用最大似然估计方法建立步骤S2和S4分别得到的因果关系置信度的可靠性度量,从而实现两个因果关系的融合。
2.根据权利要求1所述的面向金融事件的混合型因果关系发现方法,其特征在于,步骤S2中所述从所述金融事件文本数据集中抽取文本事件因果关系通过以下的文本事件因果关系抽取架构实现:
输入层:利用Stanford Parser对所述金融事件文本数据集进行数据预处理,获取每个文本事件序列的句法标签和词性标签;
序列预测层:构建融合注意力机制的Bi-LSTM-CRF网络并输入所述文本事件序列的句法标签和词性标签进行预训练,获得每个文本事件序列的双向隐状态编码信息和文本事件的标签信息,作为关系预测层的联合输入;
关系预测层:构建融合多句法结构的Bi-Tree-LSTM网络,对所述序列预测层得到的联合输入进行学习从而获取三元组结构信息的候选关系;
端到端的训练:将所述关系预测层嵌套在序列预测层之上,利用共享参数进行端到端的训练,通过SoftMax分类器对所述候选关系进行抽取从而得到文本事件因果关系。
3.根据权利要求2所述的面向金融事件的混合型因果关系发现方法,其特征在于,在所述融合注意力机制的Bi-LSTM-CRF网络中,通过其中的Bi-LSTM获取文本事件序列的双向隐状态编码信息;基于注意力机制进行二次学习来调整所述双向隐状态编码信息在原始文本事件序列上的权重分布;通过其中的CRF层基于BILOU标注模式进行解码,从而预测文本事件的标签信息。
4.根据权利要求1所述的面向金融事件的混合型因果关系发现方法,其特征在于,对所述最大似然估计方法的似然函数表达式取自然对数进行简化,再运用对数运算法则进一步简化后以求导的方式求出其最大似然估计值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911193643.1/1.html,转载请声明来源钻瓜专利网。