[发明专利]一种基于历史重现的股票数据挖掘模型和系统在审
申请号: | 201611016848.9 | 申请日: | 2016-11-19 |
公开(公告)号: | CN106780018A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 洪志令;吴梅红 | 申请(专利权)人: | 洪志令 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06Q10/04;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 361005 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 历史 重现 股票 数据 挖掘 模型 系统 | ||
技术领域
本发明涉及股票数据挖掘技术领域,尤其是涉及一种基于历史重现的股票数据挖掘模型和系统。
背景技术
随着我国证券行业的飞速发展,股票投资已成为许多家庭和个人理财的一种重要方式,是很多家庭财产收入的重要组成部分。股票市场具有高风险与高收益并存的特性,股票价格的涨跌及变化趋势也一直受到政府和投资大众的密切关注,证券市场的波动也逐渐成为衡量我国经济发展水平的一个重要指标。因此,股票价格的预测已成为经济学中一个重要的研究课题。
然而股票价格受各种经济的、政治的、社会的因素相互作用、相互影响,其变化有着很强的无序性,其数学模型往往复杂难以准确确定或者包含混沌性,从而增加了预测的难度。
数据挖掘的作用是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。股票数据挖掘的研究主要集中在4个方面:相似序列匹配、股票价格预测、交易规则抽取以及时间模式发现。
发明内容
本发明公开了一种基于历史重现的股票数据挖掘模型和系统。模型基于“历史会重演”的思想从海量的股票历史趋势线中寻求发现有价值的信息,构建的股票数据挖掘模型包括6个核心模块,分别为:数据存储中心、数据准备、数据模型与数据挖掘、数据挖掘结果、结果跟踪、性能评估。基于此模型,可构建功能丰富且扩展性强的股票大数据挖掘系统,系统一方面有利用股票挖掘方法的快速测试与实践,另一方可为用户进行股票投资提供辅助决策支持。
本发明方法的模型模块组成或步骤如下:
(1)构建数据存储中心;
(2)进行数据抽取及预处理;
(3)构建数据模型,并进行股票数据挖掘;
(4)根据数据模型、不同的挖掘目的获取不同的股票挖掘结果;
(5)对股票数据挖掘结果进行记录跟踪;
(6)对模型中各个环节进行性能评估和优化。
其中,步骤(1) 构建数据存储中心主要用于负责数据的存储,具体包括股票数据库和股票数据挖掘库。股票数据库用于存储股票相关的数据,存储内容包括:每个交易日的股票交易数据、股票列表、股票的行业分类、地域分类、概念分类、终止或暂停上市的股票列表等。股票数据挖掘库用于存储对股票进行数据挖掘的过程和结果的数据。如规范化后的股票数据、股票匹配的中间数据、每日的推荐数据、统计数据、跟踪数据等。
其中,步骤(2) 的进行数据抽取及预处理,具体为:数据抽取分为2种,入库的抽取和出库的抽取;预处理分为股票收盘价基准变换、数据量化、相对值计算和递增量计算等方面。
其中,步骤(3) 的构建数据模型,并进行股票数据挖掘,具体为:根据不同的目的,如股票预测、股票推荐等,定义不同的数据模型、学习规则等对股票数据进行挖掘。包括但不限于如下几个方面。
(A)趋势匹配。以股票近期一段时间的走势去匹配股票历史数据,从而获得相似走势。
(B)数据统计。对股票近几个交易日的涨跌幅量化值进行共现的统计,从而获取下一交易日的可能涨跌幅及出现的概率。
(C)数据分类。基于股票之间相似度计算的基础上,利用分层聚类树、k-均值、kNN等方法对股票进行聚类或者分类。
(D)模式匹配。通过预先定义的走势模式,匹配股票历史数据,获取相似的走势模式。
其中,步骤(4) 的根据数据模型、不同的挖掘目的获取不同的股票挖掘结果,结果具体的划分包括但不限于如下几个方面。
(A)股票预测。对股票未来不同时间长度,不同的内容进行预测。基于趋势匹配的数据模型方法既可预测未来一段时间的走势,也可预测近一两天的行情;基于数据统计的数据模型方法主要用于预测下一交易日的可能涨跌幅及涨跌概率。
(B)股票推荐。通过对股票预测的结果进行排序后择优推荐。区分对于未来一段时间走势的预测结果、对于近期几天行情的预测结果和对于下一交易日的预测结果三种不同时间点预测结果的择优推荐步骤。
(C)股票选择。对股票的选择分为两种类型:粗选和精选。基于数据分类的数据模型在基于股票的相似性计算后,对股票形成了分类。这些分类构成了股票的粗选;或者基于模式匹配的数据模型通过对股票进行预定义的模式匹配,匹配结果也构成了股票的粗选。在粗选的基础上,精选过程可结合一些参量进行,如换手率、成交量等。
(D)统计排序。对股票的历史数据进行统计排序,目的在于对股票现状有更好的整体理解。一些统计结果如:强相关排序、强匹配排序、N元语法排序、关联规则排序、涨跌幅排序等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于洪志令,未经洪志令许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611016848.9/2.html,转载请声明来源钻瓜专利网。