[发明专利]基于股票评论数据的数据挖掘方法和装置在审
申请号: | 201810942719.5 | 申请日: | 2018-08-17 |
公开(公告)号: | CN109300031A | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 王浩;张晨;庞旭林;杜长营;杨康 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06F16/2458;G06F16/28;G06K9/62 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝;何立春 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 股票 评论数据 方法和装置 数据挖掘 数据挖掘技术 可靠性度量 异构信息源 时序 多源异构 分布信息 股票价格 股评文本 关键特征 海量信息 极性分布 历史行为 市场走势 挖掘 大数据 精选 融合 帮助 分析 | ||
1.一种基于股票评论数据的数据挖掘方法,其中,该方法包括:
获取股票评论数据;其中,一条股票评论数据是指单个股票评论员对单个股票的单次评论数据;
基于所获取的股票评论数据,挖掘股票评论员的观点极性分布信息;
以及,基于所获取的股票评论数据,挖掘股票评论员的观点可靠性分布信息。
2.如权利要求1所述的方法,其中,该方法在获取股票评论数据的步骤之后还包括股票评论数据清洗的步骤,具体包括:
删除观点极性为中立的股票评论数据;
和/或,
删除长度小于预设阈值的股票评论序列所对应的股票评论数据;其中,股票评论序列是指同一股票评论员在不同时间对同一股票进行评论的股票评论数据的组合。
3.如权利要求1所述的方法,其中,一条股票评论数据包括:
股票评论员标识、评论时间、目标股票、包含观点极性的内容。
4.如权利要求1所述的方法,其中,所述基于所获取的股票评论数据,挖掘股票评论员的观点极性分布信息包括如下中的一种或多种:
基于所获取的股票评论数据中的同一股票评论员针对同一股票的所有历史股票评论数据,确定该股票评论员针对该股票发布看涨的股票评论数据的概率,以及确定该股票评论员针对该股票发布看跌的股票评论数据的概率;
基于所获取的股票评论数据中的同一股票评论员针对不同股票的所有历史股票评论数据,确定该股票评论员发布看涨的股票评论数据的概率,以及确定该股票评论员发布看跌的股票评论数据的概率;
基于所获取的股票评论数据中的不同股票评论员针对同一股票的所有历史股票评论数据,确定股票评论员针对该股票发布看涨的股票评论数据的概率,以及确定股票评论员针对该股票发布看跌的股票评论数据的概率;
基于所获取的股票评论数据中的不同股票评论员针对不同股票的所有历史股票评论数据,确定发布看涨的股票评论数据的概率,以及确定发布看跌的股票评论数据的概率。
5.如权利要求1所述的方法,其中,所述基于所获取的股票评论数据,挖掘股票评论员的观点可靠性分布信息包括:
根据不同股票的价格时序信息,确定所获取的股票评论数据中的同一个股票评论员针对不同股票的所有历史股票评论数据中的每一条股票评论数据的正确与否;
根据一个股票评论员的正确的股票评论数据数量和错误的股票评论数据数量,确定该股票评论员的观点的正确概率。
6.如权利要求1所述的方法,其中,该方法进一步包括:
基于同一股票评论员对同一股票的股票评论序列中的各相邻股票评论数据,提取股评数据对;
基于提取的股评数据对,统计该股票评论员保持观点的概率和改变观点的概率。
7.如权利要求1所述的方法,其中,该方法进一步包括:
基于同一股票评论员对同一股票的股票评论序列中的各相邻股票评论数据,提取股评数据对;
基于提取的股评数据对,确定该股票评论员在观点正确的前提下改变观点的概率TSRatio,以及确定该股票评论员在观点错误的前提下改变观点的概率FSRatio。
8.一种基于股票评论数据的数据挖掘装置,其中,该装置包括:
获取单元,适于获取股票评论数据;其中,一条股票评论数据是指单个股票评论员对单个股票的单次评论数据;
挖掘单元,适于基于所获取的股票评论数据,挖掘股票评论员的观点极性分布信息;以及,适于基于所获取的股票评论数据,挖掘股票评论员的观点可靠性分布信息。
9.一种电子设备,其特征在于,所述电子设备包括:处理器,以及存储有可在处理器上运行的计算机程序的存储器;
其中,所述处理器,用于在执行所述存储器中的计算机程序时执行权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810942719.5/1.html,转载请声明来源钻瓜专利网。