[发明专利]一种互联网环境下的金融市场风险预警方法在审
申请号: | 201910208570.2 | 申请日: | 2019-03-19 |
公开(公告)号: | CN109934503A | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 倪丽萍;李莹;倪志伟;朱旭辉;李想;夏千姿 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/04;G06F16/951;G06F16/36;G06F17/27 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种互联网环境下的金融市场风险预警方法,其步骤包括:1、数据预处理2、使用TF算法选取情感种子词并利用Word2vec进行情感词典扩展,定义程度副词权重从而计算出文本情感强度指数3、利用MF‑DCCA模型计算交叉多重分形谱4、构建对股票异常收益产生影响的特征指标5、构建股票异常收益预测分析模型。本发明能构建出更加精准的风险预警模型,从而实现更加准确的风险预测,为金融市场监管提供依据,为投资者投资决策提供参考。 | ||
搜索关键词: | 风险预警 构建 金融市场 互联网环境 数据预处理 分析模型 风险预测 模型计算 强度指数 情感词典 收益预测 算法选取 特征指标 文本情感 种子词 股票 分形 权重 参考 收益 监管 决策 投资 | ||
【主权项】:
1.一种互联网环境下的金融市场风险预警方法,其特征是按照如下步骤进行:步骤1、数据预处理:步骤1.1、定义时间段为T,T={T1,…Tt,…TF},1≤t≤F,Tt表示第t个时间段,在第t个时间段Tt内选取任意一支股票i所对应的股吧评论文本集合,记为
步骤1.2、对第t个时间段Tt内股票i所对应的股吧评论文本集合
进行去停用词及分词处理,得到股票i在第t个时间段Tt内文本向量![]()
表示第t个时间段Tt内股票i所对应的股吧评论文本集合
中第r个句子;R表示第t个时间段Tt内股票i所对应的股吧评论文本集合
中句子总数;步骤2、计算情感指数:步骤2.1、在股票i上涨时刻后的一段时间内对股票i所对应的股吧评论进行抓取后使用TF词频算法,选出词频最高的N个积极情感词语,记为{Posn|n=1,2,…,N},并作为积极情感词典的种子词语;同理,在所选股票i下跌时刻后的一段时间内对股票i所对应的股吧评论进行抓取后使用TF词频算法,选出词频最高的N个消极情感词语,记为{Negn|n=1,2,…,N},并作为消极情感词典的种子词语;由N个积极情感词典的种子词语和N个消极情感词典的种子词语合并为2N个情感词典的种子词语;步骤2.2、使用Word2Vec模型将文本语料库中的词语映射到高维连续向量空间中,以实现词向量训练,并得到词向量集合![]()
为第t个词语Wt的词向量表示,1≤t≤|V|,|V|表示词向量集合
中词语的总数;步骤2.3、计算词向量集合
中的第t个词语的词向量表示
分别与所述2N个情感词典种子词语的余弦相似度,得到第t个余弦相似度集合Sim(Wt),从而得到相似度向量集合{Sim(Wt)|t=1,2,...,|V|};设置相似值阈值为ε,当max(Sim(Wt))≥ε时,将第t个词语Wt加入max(Sim(Wt))所对应的情感词典种子词语所属的情感词典中,从而得到扩充后的情感词典集,记为Se={SeP,SeN},SeP为积极情感词典,SeN为消极情感词典;步骤2.4、确定程度副词权重:获取基础程度副词词典,记为Adv={Adv1,…,Advd,…,Advu},1≤d≤u,Advd为基础程度副词词典Adv中第d个程度副词;从基础程度副词词典Adv中选择最轻程度副词Advs和最重程度副词Advh并分别赋予初始权重
和
使用Word2Vec模型训练所述基础程度副词词典Adv,得到基础程度副词词典Adv中所有程度副词的词向量;计算最轻程度副词Advs和最重程度副词Advh分别与基础程度副词词典Adv中所有程度副词的词向量的余弦相似度,得到相似值向量组
其中,
为第d个程度副词Advd与最轻程度副词Advs的余弦相似度,
为第d个程度副词Advd与最重程度副词Advh的余弦相似度;步骤2.5、利用式(1)计算第d个程度副词Advd的权重![]()
步骤2.6、计算单词的情感值:从在第t个时间段Tt内股票i所对应的股吧评论文本集合
中抽取k个情感词记为
其中,
为股吧评论文本集合
中第g个情感词,1≤g≤k≤m,若第g个情感词
有程度副词修饰,则利用式(2)得到第g个情感词
的情感强度![]()
式(2)中,
表示股吧评论文本集合
中第g个示情感词
的正负情感属性,且
N表示否定词的数量;步骤2.7、计算文本的情感值:假设第t个时间段Tt内股票i所对应的股吧评论文本集合
中第r句子
含有的情感词集合为
其中,
表示第t个时间段Tt内股票i所对应的股吧评论文本集合
中第r个句子
的第e个情感词,1≤e≤E≤k;利用式(3)得到第t个时间段Tt内股票i所对应的股吧评论文本集合
中第r个句子
的情感强度
从而得到第t个时间段Tt内股票i所对应的股吧评论文本集合
中所有句子情感强度
并求取平均值,得到第t个时间段Tt内股票i的情感强度
进而得到T时间段内股票i的情感强度序列
以及T时间段的情感总强度![]()
步骤3、计算交叉多重分形谱:步骤3.1、根据T时间段内股票i的情感强度
获取相应的百度媒体指数
从而形成两个长度相等的时间序列;步骤3.3、对两个时间序列进行多重交叉分形分析处理,得到T时间段的奇异指数序列![]()
表示T时间段内股票i的第b个奇异指数,1≤b≤B,B表示奇异指数的总数;q表示多重交叉分形模型中去趋势协方差的阶数;步骤3.4、利用式(4)计算T时间段内股票i的多重分型谱的宽度![]()
步骤4、构建T时间段内股票i的风险特征变量
包括:市场内部特征指标和市场外部特征指标;所述风险变量
的状态变量为
其中0表示T时间段内股票i发生金融风险,1表示T时间段内股票i未发生金融风险;所述市场内部特征指标包括:T时间段内股票i的价格记为
T时间段内股票i的对数收益记为
T时间段股票i的交易量记为
T时间段内股票i的流通市值记为
T时间段内股票i的最高价记为
T时间段内股票i的最低价记为
所述市场外部特征指标包括:T时间段内股票i的媒体关注度为
T时间段内股票i的的异常媒体关注度的平均值为
且
T时间段内股票i的的投资者情感强度为
T时间段内股票i的的异常投资者情感强度为
且
T时间段内股票i的多重分型谱的宽度
步骤5、构建预测分析模型:步骤5.1、构建样本集:由所述风险特征变量
与其状态变量
构成股票i的第T个样本点
并根据步骤2.6‑步骤4的方法,得到M个样本点构成的样本集合
步骤5.2、利用Twin‑SVM分类方法对所述样本集合
进行训练,得到训练后的Twin‑SVM分类预测模型,以实现股票i的风险预警。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910208570.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于室内LBS的智慧会展管理系统
- 下一篇:一种饭店星级评定方法及终端
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理