[发明专利]舆情指数的预测方法及装置、计算机设备和可读存储介质有效
申请号: | 201810909879.X | 申请日: | 2018-08-10 |
公开(公告)号: | CN109087205B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 邓江东;李磊;马维英 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06F40/289;G06F16/35 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 舆情 指数 预测 方法 装置 计算机 设备 可读 存储 介质 | ||
本申请涉及一种舆情指数的预测方法,该预测方法包括:获取股票舆情信息;对所述股票舆情信息进行分词,得到初始词序列,所述初始词序列包括至少一个分词词语;对所述初始词序列进行词性标注,得到标注词序列及所述标注词序列对应的词性特征序列;根据所述标注词序列和所述词性特征序列,得到词向量序列;将所述词向量序列和所述词性特征序列输入预设的舆情模型,得到股票舆情指数。该舆情指数的预测方法可以辅助用户对未来股票的价格做出预测,提高了用户预测的准确性。本申请还涉及一种舆情指数的预测装置、计算机设备和计算机可读存储介质。
技术领域
本申请涉及信息处理技术领域,特别是涉及一种舆情指数的预测方法及装置,计算机设备和计算机可读存储介质。
背景技术
现如今,金融投资已经逐渐成为普通用户理财的一个手段,比如,用户可通过股票交易的方式进行理财。然而,由于大多数用户都是散户,不像金融机构那么专业,并且也没有相关的技术手段可以辅助他们决策,因此很多时候他们买卖股票时,都是依靠自己的主观意愿看K线图涨跌。
在目前市场上存在的金融类产品中,只有关于股票价格的K线图,导致用户在选择股票来投资的分析过程中,只能通过分析以往冰冷的交易数据来对股票未来的价格做出预测。
然而,采用上述方法导致用户预测的准确性较低,使得用户投资存在很大的风险。
发明内容
基于此,有必要针对上述用户预测的准确性较低的问题,提供一种能辅助用户预测,并提高预测准确性的舆情指数的预测方法及装置、计算机设备和计算机可读存储介质。
一种舆情指数的预测方法,所述预测方法包括:
获取股票舆情信息;
对所述股票舆情信息进行分词,得到初始词序列,所述初始词序列包括至少一个分词词语;
对所述初始词序列进行词性标注,得到标注词序列及所述标注词序列对应的词性特征序列;
根据所述标注词序列和所述词性特征序列,得到词向量序列;
将所述词向量序列和所述词性特征序列输入预设的舆情模型,得到股票舆情指数。
在其中一个实施例中,所述将所述词向量序列和所述词性特征序列输入预设的舆情模型,得到股票舆情指数的步骤之后包括:
获取所述股票对应的历史舆情指数;
根据所述股票舆情指数和所述历史舆情指数绘制股票舆情K线图。
在其中一个实施例中,所述对所述股票舆情信息进行分词,得到初始词序列的步骤包括:
获取金融种子词,对所述金融种子词进行近义词扩充,得到金融关键词,其中,所述金融种子词包括与所述股票相关的词语;
根据所述金融种子词和所述金融关键词对所述股票舆情信息进行分类,得到每一所述股票舆情信息对应的股票类别;
根据所述股票类别对所述股票舆情信息进行分词,得到所述初始词序列。
在其中一个实施例中,所述对所述初始词序列进行词性标注,得到标注词序列及所述标注词序列对应的词性特征序列的步骤包括:
对所述初始词序列进行词性标注,得到初始词性特征序列;
获取干扰词及所述干扰词的词性特征,将所述干扰词及所述干扰词的词性特征与所述初始词性特征序列匹配,获取包含所述干扰词的股票舆情信息对应的干扰词序列,以及所述干扰词序列对应的干扰词性特征序列;
去除所述初始词序列中的所述干扰词序列,得到所述标注词序列,以及去除所述初始词性特征序列中的所述干扰词性特征序列,得到所述词性特征序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810909879.X/2.html,转载请声明来源钻瓜专利网。