[发明专利]基于文本摘要情感挖掘的股票趋势预测方法和系统在审
申请号: | 202011497913.0 | 申请日: | 2020-12-17 |
公开(公告)号: | CN112527866A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 齐甜方;蒋洪迅 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/33;G06F16/35;G06F40/242;G06F40/289;G06N3/04;G06N3/08;G06Q40/04 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 孙楠 |
地址: | 100872 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文本 摘要 情感 挖掘 股票 趋势 预测 方法 系统 | ||
1.一种基于文本摘要情感挖掘的股票趋势预测方法,其特征在于,包括以下步骤:
S1获取股票相关的若干新闻数据;
S2通过所述新闻数据,获得各新闻的文本摘要;
S3根据预建立的情感词库,提取各所述文本摘要中的情感词,并根据所述情感词表达情感的强弱,对各所述文本摘要的情感进行打分;
S4将各所述文本摘要的情感分值作为特征向量与股票历史变化趋势数据输入预建立的股票预测模型中进行计算,若计算结果大于等于零,则股票呈上涨趋势;若计算结果小于零,则股票呈下跌趋势。
2.如权利要求1所述的基于文本摘要情感挖掘的股票趋势预测方法,其特征在于,所述步骤S1中获取股票相关的若干新闻数据包括:选定待研究的股票,获取所述股票一定时间内的股票代码简称、日期、开盘价、最高价、最低价、收盘价、涨跌幅、成交量、成交金额、换手率、A股流通市值、总市值、市盈率和市销率中至少一种,生成检索关键词,选定可靠的新闻来源,并在所述新闻来源中检索与股票相关的新闻数据。
3.如权利要求1所述的基于文本摘要情感挖掘的股票趋势预测方法,其特征在于,所述步骤S2的具体操作过程为:
S2.1对提取的新闻数据做分词处理并去除标点符号,将无关的实体替换成标签,并将新闻数据中的词转换为词典索引;
S2.2采用提取的新闻数据训练新闻来源选择模型,得到可靠的新闻来源;
S2.3从所述可靠的新闻来源再次提取新闻数据,并通过Attention机制的Seq2Seq模型获取各新闻的文本摘要。
4.如权利要求3所述的基于文本摘要情感挖掘的股票趋势预测方法,其特征在于,所述新闻来源选择模型的训练过程如下:从某一新闻来源处,检索某一历史时间中与待预测股票相关的新闻数据,并获取所述历史时间内待预测股票的实际变化趋势,用所述新闻数据预测所述待预测股票的变化趋势,将预测的变化趋势和实际的变化趋势进行比较,并根据比较结果进行打分;对所有待选的新闻来源进行上面的操作,得到所有待选的新闻来源的分值,将所述分值超过阈值的新闻来源选定为可靠的新闻来源。
5.如权利要求3所述的基于文本摘要情感挖掘的股票趋势预测方法,其特征在于,所述通过Attention机制的Seq2Seq模型获取各新闻的文本摘要的过程为:将所述新闻数据作为输入向量序列输入Attention机制的Seq2Seq模型获得各个词的生成概率,从而得到所有所述新闻数据的词的生成概率,选择生成概率高的词,从而生成新闻的文本摘要。
6.如权利要求1-5任一项所述的基于文本摘要情感挖掘的股票趋势预测方法,其特征在于,所述步骤S3中的情感词库包括:情感词,财经新闻中具有趋向性的专业术语,表示否定的词以及程度副词。
7.如权利要求6所述的基于文本摘要情感挖掘的股票趋势预测方法,其特征在于,所述步骤S3的具体操作过程为:将所述情感词库中的情感词和财经新闻中具有趋向性的专业术语分为表达积极情感、表达消极情感两类,设定各所述情感词库中的情感词和财经新闻中具有趋向性的专业术语的分值,若表达积极情感则加相应分值,若表达消极情感则减去相应分值,将各所述新闻数据的文本摘要分成若干句簇,结合否定词和程度副词获得各所述句簇的得分。
8.如权利要求7所述的基于文本摘要情感挖掘的股票趋势预测方法,其特征在于,所述结合否定词和程度副词获得各所述句簇的得分规则为:只出现否定词的得分为Un=(0.1×Cn-1)Cn×S,只出现程度副词的得分为:Us=∏Ls×S,同时存在否定词和程度副词时,若否定词在前,则将否定词的总分数和所述程度副词的总分数相加;若否定词在后,则将否定词的总分数和所述程度副词的总分数相乘,Un是否定词总分数,Us是程度副词的总分数,Cn是否定词的得分,Ls是程度副词的得分,S是不包括情感词和财经新闻中具有趋向性的专业术语的得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011497913.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种生活垃圾渗滤液处理工艺
- 下一篇:一种网页监控方法、装置及系统