[发明专利]金融市场收益预测模型的构建方法、装置和电子设备在审
申请号: | 202111494885.1 | 申请日: | 2021-12-08 |
公开(公告)号: | CN114169316A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 谢伟;周文泽;刘慕雨;潘玲 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/284;G06Q10/04;G06Q40/06 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 赵婷 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 金融市场 收益 预测 模型 构建 方法 装置 电子设备 | ||
本公开提供了一种金融市场收益预测模型的构建方法,可以应用于金融领域或其他领域。该方法包括:获取预测词典,其中,所述预测词典包括通用词典和第一文本数据,所述第一文本数据包括新闻数据;利用所述预测词典,确定情绪指数;以及基于所述情绪指数,构建预测模型。本公开还提供了一种金融市场收益预测方法、装置、设备、存储介质和程序产品。
技术领域
本公开涉及金融领域,具体涉及金融市场收益预测领域,更具体地涉及一种金融市场收益预测模型的构建方法、装置、电子设备、介质和程序产品。
背景技术
进入大数据时代以来,互联网上文本数据海量增长,越来越多的金融科技公司开始采用文本大数据方法对金融市场进行研究。股票市场作为金融市场最活跃的部分,对其收益率的研究也一直都是业界热点。在我国,股票市场的投资者以散户为主,这些投资者倾向于从财经新闻门户网站中获取投资信息。财经新闻作为投资信息的载体,多以文本数据的形式存在,其中蕴含的情感态度在很大程度上会对投资者的投资倾向产生影响,进而对股价的波动产生联动效应。因此对财经新闻文本信息进行分析,挖掘其中所包含的情感与情绪,对应股票市场收益率研究具有重要意义。
传统的文本分析方法多使用词典法,使用的词典有哈佛词典、MPQA主观情感词典、SentiWordNet词典、知网HowNet词典(BETA)及清华褒贬义词典等。上述提及的情感词典是目前进行文本分析时最常使用的通用型词典,然而这些词典的构建大多基于文学作品、媒体报道等,在特定领域的适用性和准确性存在一定的问题。
因此,当利用词典法对金融市场进行文本分析时,如何构建适用于金融领域的情感词典,是亟待解决的技术难题。
发明内容
鉴于上述问题,本公开提供了一种金融市场收益预测模型的构建方法、装置、电子设备、介质和程序产品。
根据本公开的第一个方面,提供了一种金融市场收益预测模型的构建方法,包括:获取预测词典,其中,所述预测词典包括通用词典和第一文本数据,所述第一文本数据包括新闻数据;利用所述预测词典,确定情绪指数;以及基于所述情绪指数,构建预测模型。
根据本公开的实施例,所述获取预测词典的步骤包括:获取N个所述通用词典,其中N≥1;合并所述N个通用词典,得到第一词典;对所述第一词典进行去重操作,获得第二词典;获取第一内的所述第一文本数据;基于所述第一文本数据,构建第一词库;以及基于所述第二词典和所述第一词库,构建预测词典。
根据本公开的实施例,所述构建预测词典的步骤包括:提取所述第一词库与所述第二词典的重合词,形成第三词典;按第一预设条件对所述第三词典进行筛选,获取筛选后的第四词典;将所述第一词库与所述第四词典合并,得到第五词典;以及对所述第五词典进行去重操作,获得预测词典。
根据本公开的实施例,所述对所述第五词典进行去重操作的步骤包括:计算所述第五词典中所有词向量的余弦相似度;和基于所述余弦相似度进行去重操作。
根据本公开的实施例,所述利用所述预测词典,确定情绪指数的步骤包括:获取预设单位时间内的第二文本数据;利用所述预测词典,确定所述第二文本数据中的积极词数和消极词数;以及基于所述积极词数和消极词数,计算情绪指数。
根据本公开的实施例,所述计算情绪指数的公式为:
式中:NP表示积极词数,Nn表示消极词数,SI表示情绪指数。
根据本公开的实施例,所述基于所述情绪指数,构建预测模型的步骤包括:将所述情绪指数作为影响因子,构建初始模型;获取历史收益数据;以及基于所述历史收益数据,训练所述初始模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111494885.1/2.html,转载请声明来源钻瓜专利网。