[发明专利]一种互联网环境下的金融市场风险预警方法在审

专利信息
申请号: 201910208570.2 申请日: 2019-03-19
公开(公告)号: CN109934503A 公开(公告)日: 2019-06-25
发明(设计)人: 倪丽萍;李莹;倪志伟;朱旭辉;李想;夏千姿 申请(专利权)人: 合肥工业大学
主分类号: G06Q10/06 分类号: G06Q10/06;G06Q40/04;G06F16/951;G06F16/36;G06F17/27
代理公司: 安徽省合肥新安专利代理有限责任公司 34101 代理人: 陆丽莉;何梅生
地址: 230009 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种互联网环境下的金融市场风险预警方法,其步骤包括:1、数据预处理2、使用TF算法选取情感种子词并利用Word2vec进行情感词典扩展,定义程度副词权重从而计算出文本情感强度指数3、利用MF‑DCCA模型计算交叉多重分形谱4、构建对股票异常收益产生影响的特征指标5、构建股票异常收益预测分析模型。本发明能构建出更加精准的风险预警模型,从而实现更加准确的风险预测,为金融市场监管提供依据,为投资者投资决策提供参考。
搜索关键词: 风险预警 构建 金融市场 互联网环境 数据预处理 分析模型 风险预测 模型计算 强度指数 情感词典 收益预测 算法选取 特征指标 文本情感 种子词 股票 分形 权重 参考 收益 监管 决策 投资
【主权项】:
1.一种互联网环境下的金融市场风险预警方法,其特征是按照如下步骤进行:步骤1、数据预处理:步骤1.1、定义时间段为T,T={T1,…Tt,…TF},1≤t≤F,Tt表示第t个时间段,在第t个时间段Tt内选取任意一支股票i所对应的股吧评论文本集合,记为步骤1.2、对第t个时间段Tt内股票i所对应的股吧评论文本集合进行去停用词及分词处理,得到股票i在第t个时间段Tt内文本向量表示第t个时间段Tt内股票i所对应的股吧评论文本集合中第r个句子;R表示第t个时间段Tt内股票i所对应的股吧评论文本集合中句子总数;步骤2、计算情感指数:步骤2.1、在股票i上涨时刻后的一段时间内对股票i所对应的股吧评论进行抓取后使用TF词频算法,选出词频最高的N个积极情感词语,记为{Posn|n=1,2,…,N},并作为积极情感词典的种子词语;同理,在所选股票i下跌时刻后的一段时间内对股票i所对应的股吧评论进行抓取后使用TF词频算法,选出词频最高的N个消极情感词语,记为{Negn|n=1,2,…,N},并作为消极情感词典的种子词语;由N个积极情感词典的种子词语和N个消极情感词典的种子词语合并为2N个情感词典的种子词语;步骤2.2、使用Word2Vec模型将文本语料库中的词语映射到高维连续向量空间中,以实现词向量训练,并得到词向量集合为第t个词语Wt的词向量表示,1≤t≤|V|,|V|表示词向量集合中词语的总数;步骤2.3、计算词向量集合中的第t个词语的词向量表示分别与所述2N个情感词典种子词语的余弦相似度,得到第t个余弦相似度集合Sim(Wt),从而得到相似度向量集合{Sim(Wt)|t=1,2,...,|V|};设置相似值阈值为ε,当max(Sim(Wt))≥ε时,将第t个词语Wt加入max(Sim(Wt))所对应的情感词典种子词语所属的情感词典中,从而得到扩充后的情感词典集,记为Se={SeP,SeN},SeP为积极情感词典,SeN为消极情感词典;步骤2.4、确定程度副词权重:获取基础程度副词词典,记为Adv={Adv1,…,Advd,…,Advu},1≤d≤u,Advd为基础程度副词词典Adv中第d个程度副词;从基础程度副词词典Adv中选择最轻程度副词Advs和最重程度副词Advh并分别赋予初始权重使用Word2Vec模型训练所述基础程度副词词典Adv,得到基础程度副词词典Adv中所有程度副词的词向量;计算最轻程度副词Advs和最重程度副词Advh分别与基础程度副词词典Adv中所有程度副词的词向量的余弦相似度,得到相似值向量组其中,为第d个程度副词Advd与最轻程度副词Advs的余弦相似度,为第d个程度副词Advd与最重程度副词Advh的余弦相似度;步骤2.5、利用式(1)计算第d个程度副词Advd的权重步骤2.6、计算单词的情感值:从在第t个时间段Tt内股票i所对应的股吧评论文本集合中抽取k个情感词记为其中,为股吧评论文本集合中第g个情感词,1≤g≤k≤m,若第g个情感词有程度副词修饰,则利用式(2)得到第g个情感词的情感强度式(2)中,表示股吧评论文本集合中第g个示情感词的正负情感属性,且N表示否定词的数量;步骤2.7、计算文本的情感值:假设第t个时间段Tt内股票i所对应的股吧评论文本集合中第r句子含有的情感词集合为其中,表示第t个时间段Tt内股票i所对应的股吧评论文本集合中第r个句子的第e个情感词,1≤e≤E≤k;利用式(3)得到第t个时间段Tt内股票i所对应的股吧评论文本集合中第r个句子的情感强度从而得到第t个时间段Tt内股票i所对应的股吧评论文本集合中所有句子情感强度并求取平均值,得到第t个时间段Tt内股票i的情感强度进而得到T时间段内股票i的情感强度序列以及T时间段的情感总强度步骤3、计算交叉多重分形谱:步骤3.1、根据T时间段内股票i的情感强度获取相应的百度媒体指数从而形成两个长度相等的时间序列;步骤3.3、对两个时间序列进行多重交叉分形分析处理,得到T时间段的奇异指数序列表示T时间段内股票i的第b个奇异指数,1≤b≤B,B表示奇异指数的总数;q表示多重交叉分形模型中去趋势协方差的阶数;步骤3.4、利用式(4)计算T时间段内股票i的多重分型谱的宽度步骤4、构建T时间段内股票i的风险特征变量包括:市场内部特征指标和市场外部特征指标;所述风险变量的状态变量为其中0表示T时间段内股票i发生金融风险,1表示T时间段内股票i未发生金融风险;所述市场内部特征指标包括:T时间段内股票i的价格记为T时间段内股票i的对数收益记为T时间段股票i的交易量记为T时间段内股票i的流通市值记为T时间段内股票i的最高价记为T时间段内股票i的最低价记为所述市场外部特征指标包括:T时间段内股票i的媒体关注度为T时间段内股票i的的异常媒体关注度的平均值为T时间段内股票i的的投资者情感强度为T时间段内股票i的的异常投资者情感强度为T时间段内股票i的多重分型谱的宽度步骤5、构建预测分析模型:步骤5.1、构建样本集:由所述风险特征变量与其状态变量构成股票i的第T个样本点并根据步骤2.6‑步骤4的方法,得到M个样本点构成的样本集合步骤5.2、利用Twin‑SVM分类方法对所述样本集合进行训练,得到训练后的Twin‑SVM分类预测模型,以实现股票i的风险预警。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910208570.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top