[发明专利]基于标签组合的股市分析方法在审
| 申请号: | 201910621240.6 | 申请日: | 2019-07-10 |
| 公开(公告)号: | CN110335152A | 公开(公告)日: | 2019-10-15 |
| 发明(设计)人: | 赵铁军;徐志明;曹海龙;徐冰;刘国峰;朱聪慧;杨沐昀 | 申请(专利权)人: | 哈尔滨工业大学 |
| 主分类号: | G06Q40/04 | 分类号: | G06Q40/04 |
| 代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 刘冰 |
| 地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 标签组合 股市分析 标签 股票 热门 行情数据 网络图 传统的 基本面 解释性 黑盒 融合 展示 分析 学习 | ||
1.基于标签组合的股市分析方法,其特征在于:所述方法具体过程为:
步骤一、定义股票和标签的基本特征;
步骤二、基于步骤一建立标签之间的关系以及股票之间的关系;
步骤三、判断是否为股票开盘时间,若是,执行步骤四;若否,结束;
步骤四、获取当前股票的行情数据,包括各个股票的最高价、最低价、当前价格、上一个交易日各个股票的收盘价和各个股票涨幅;
步骤五、基于步骤一和步骤二建立的标签之间的关系、股票之间的关系和步骤四获取当前股票的行情数据,选出热门的标签组合,基于热门的标签组合,选出热门标签;
步骤六、将步骤五选出的热门标签以网络图的方式展示。
2.根据权利要求1所述基于标签组合的股市分析方法,其特征在于:所述步骤一中定义股票和标签的基本特征;具体过程为:
标签分类为行业标签、地域标签、概念标签、特征标签、技术标签;
股票存储方式:
股票代码、股票所属市场、股票名称、风格标签、行业标签、概念标签;
标签存储方式:
标签代码、标签名称、标签类型、标签包含的股票;
股票基本特征的定义:
股票热度计算:
式中,hot为股票热度,sigmoid为逻辑函数,z为逻辑函数的函数输入值;
股票强度的计算:
选取一定的历史时间窗口,统计一支股票涨幅超过8%的次数作为股票强度;
标签热度计算:
标签包含股票的热度的平均值。
3.根据权利要求1或2所述基于标签组合的股市分析方法,其特征在于:所述步骤二中基于步骤一建立标签之间的关系和股票之间的关系;具体过程为:
一、计算标签之间的关系;过程为:
a)计算基于集合相似度的标签关系:
其中,Relation表示基于集合相似度的标签关系;pi表示第i个标签对应的股票集合,pj表示第j个标签对应的股票集合,min表示求最小值;
b)计算基于词向量相似度的标签关系:
1)首先从腾讯获得开源的词向量;
2)从互联网公开的数据中获取金融数据;
3)利用获取的金融数据使用word2vec模型对开源的词向量进行训练,开源的词向量训练完毕后,得到最终模型,模型中包含训练后的词向量;
4)利用训练后的词向量计算标签之间的关系,即基于词向量的相似度;
利用训练后的词向量计算标签之间的关系,即基于词向量相似度,公式如下:
其中,Relation表示基于词向量相似度的标签关系;ti表示第i个标签对应的词向量,tj表示第j个标签对应的词向量,|ti|l2表示求ti的L2范数,|tj|l2表示求tj的L2范数;*表示乘法;
最终,由基于集合相似度的标签关系Relation和基于词向量相似度的标签关系Relation值做加和来确定最终的标签之间的关系;
二、计算股票之间的关系;过程为:
其中,Relation(sm,sn)表示股票之间的关系,sm表示第m只股票的标签集合,sn表示第n只股票的标签集合;log()表示对数函数,∩表示集合的求交运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910621240.6/1.html,转载请声明来源钻瓜专利网。





