[发明专利]基于股票评论数据的数据挖掘方法和装置在审
申请号: | 201810942719.5 | 申请日: | 2018-08-17 |
公开(公告)号: | CN109300031A | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 王浩;张晨;庞旭林;杜长营;杨康 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06F16/2458;G06F16/28;G06K9/62 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝;何立春 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 股票 评论数据 方法和装置 数据挖掘 数据挖掘技术 可靠性度量 异构信息源 时序 多源异构 分布信息 股票价格 股评文本 关键特征 海量信息 极性分布 历史行为 市场走势 挖掘 大数据 精选 融合 帮助 分析 | ||
本发明公开了一种基于股票评论数据的数据挖掘方法和装置,该方法包括:获取股票评论数据;其中,一条股票评论数据是指单个股票评论员对单个股票的单次评论数据;基于所获取的股票评论数据,挖掘股票评论员的观点极性分布信息;以及,基于所获取的股票评论数据,挖掘股票评论员的观点可靠性分布信息。本发明融合了多种异构信息源,例如股票价格时序、股评文本内容以及发表股评的股票评论员的历史行为,基于该多源异构大数据,借助数据挖掘技术深入分析并提取关键特征,利用这些特征进行股评可靠性度量,从而从海量信息中精选出优质股票,能够帮助投资者更加准确地理解市场走势以及股票动态,供投资者或股市分析员使用。
技术领域
本发明涉及人工智能和大数据领域,具体涉及一种基于股票评论数据的数据挖掘方法、装置、电子设备和计算机可读存储介质。
背景技术
投资者通常会利用搜索引擎寻找相关价值信息帮助其最终决策,而这些决策过程大部分是依靠人的分析判断以及经验。事实上,互联网中的股票评论数据包含了丰富且有价值的语义信息,能够帮助投资者理解市场走势以及股票动态。已有的股评分析方法通常仅仅聚焦在捕获股评的情感极性,从而理解股评对于市场走势的宏观作用。然而,互联网中的股评往往包含了大量的噪声,如水军以及个人主观倾向从众心理等,从而严重地影响投资者的判断。因此利用人工智能技术对股评信息进行细粒度权威性分析,进而自动地为股民和股票分析师从海量信息中精选优质股票是非常有意义的。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于股票评论数据的数据挖掘方法、装置、电子设备和计算机可读存储介质。
依据本发明的一个方面,提供了一种基于股票评论数据的数据挖掘方法,该方法包括:
获取股票评论数据;其中,一条股票评论数据是指单个股票评论员对单个股票的单次评论数据;
基于所获取的股票评论数据,挖掘股票评论员的观点极性分布信息;
以及,基于所获取的股票评论数据,挖掘股票评论员的观点可靠性分布信息。
可选地,该方法在获取股票评论数据的步骤之后还包括股票评论数据清洗的步骤,具体包括:
删除观点极性为中立的股票评论数据;
和/或,
删除长度小于预设阈值的股票评论序列所对应的股票评论数据;其中,股票评论序列是指同一评论员在不同时间对同一股票进行评论的股票评论数据的组合。
可选地,一条股票评论数据包括:
股票评论员标识、评论时间、目标股票、包含观点极性的内容。
可选地,所述基于所获取的股票评论数据,挖掘股票评论员的观点极性分布信息包括如下中的一种或多种:
基于所获取的股票评论数据中的同一股票评论员针对同一股票的所有历史股票评论数据,确定该股票评论员针对该股票发布看涨的股票评论数据的概率,以及确定该股票评论员针对该股票发布看跌的股票评论数据的概率;
基于所获取的股票评论数据中的同一股票评论员针对不同股票的所有历史股票评论数据,确定该股票评论员发布看涨的股票评论数据的概率,以及确定该股票评论员发布看跌的股票评论数据的概率;
基于所获取的股票评论数据中的不同股票评论员针对同一股票的所有历史股票评论数据,确定股票评论员针对该股票发布看涨的股票评论数据的概率,以及确定股票评论员针对该股票发布看跌的股票评论数据的概率;
基于所获取的股票评论数据中的不同股票评论员针对不同股票的所有历史股票评论数据,确定发布看涨的股票评论数据的概率,以及确定发布看跌的股票评论数据的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810942719.5/2.html,转载请声明来源钻瓜专利网。