[发明专利]评价股票评论可靠性的方法和装置在审
申请号: | 201810942615.4 | 申请日: | 2018-08-17 |
公开(公告)号: | CN109035025A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 王浩;张晨;庞旭林;杜长营;杨康 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06K9/62;G06N99/00 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝;何立春 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 股票 机器学习模型 评论数据 方法和装置 评论 分类模型 序列集 径向基核函数 可靠性预测 支持向量机 市场走势 特征向量 提取特征 准确度 预测 向量 输出 帮助 | ||
本发明公开了一种评价股票评论可靠性的方法和装置,该方法包括:基于股票评论数据集和股价序列集提取特征向量,利用所提取的特征向量训练基于径向基核函数的支持向量机SVM模型,利用股价序列集训练用于预测股价的机器学习模型,集成SVM模型和用于预测股价的机器学习模型,得到用于评价股票评论可靠性的分类模型,将待评价的股票评论数据输入到用于评价股票评论可靠性的分类模型,得到输出的评价结果。本发明对现有的机器学习模型进行特殊处理及训练,对股票评论数据进行可靠性预测,方便快捷,准确度高,能够帮助投资者更加准确地理解市场走势以及股票动态,供投资者或股市分析员使用。
技术领域
本发明涉及人工智能和大数据领域,具体涉及一种评价股票评论可靠性的方法、装置、电子设备和计算机可读存储介质。
背景技术
投资者通常会利用搜索引擎寻找相关价值信息帮助其最终决策,而这些决策过程大部分是依靠人的分析判断以及经验。事实上,互联网中的股票评论数据包含了丰富且有价值的语义信息,能够帮助投资者理解市场走势以及股票动态。已有的股票评论分析方法通常仅仅聚焦在捕获股票评论的情感极性,从而理解股票评论对于市场走势的宏观作用。然而,互联网中的股票评论往往包含了大量的噪声,如水军以及个人主观倾向从众心理等,从而严重地影响投资者的判断。因此利用人工智能技术对股票评论信息进行细粒度权威性分析,进而自动地为股民和股票分析师从海量信息中精选优质股票是非常有意义的。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的评价股票评论可靠性的方法、装置、电子设备和计算机可读存储介质。
依据本发明的一个方面,提供了一种评价股票评论可靠性的方法,该方法包括:
基于股票评论数据集和股价序列集提取特征向量;
利用所提取的特征向量训练基于径向基核函数的支持向量机SVM模型;
利用股价序列集训练用于预测股价的机器学习模型;
集成所述SVM模型和用于预测股价的机器学习模型,得到用于评价股票评论可靠性的分类模型;
将待评价的股票评论数据输入到所述用于评价股票评论可靠性的分类模型,得到输出的评价结果。
根据本发明的另一个方面,提供了一种评价股票评论可靠性的装置,该装置包括:
特征提取单元,适于基于股票评论数据集和股价序列集提取特征向量;
第一模型训练单元,适于利用所提取的特征向量训练基于径向基核函数的支持向量机SVM模型;
第二模型训练单元,适于利用股价序列集训练用于预测股价的机器学习模型;
模型集成单元,适于集成所述SVM模型和用于预测股价的机器学习模型,得到用于评价股票评论可靠性的分类模型;
股评可靠性预测单元,适于将待评价的股票评论数据输入到所述用于评价股票评论可靠性的分类模型,得到输出的评价结果。
根据本发明的又一个方面,提供了一种电子设备,所述电子设备包括:处理器,以及存储有可在处理器上运行的计算机程序的存储器;
其中,所述处理器,用于在执行所述存储器中的计算机程序时执行上述任一项所述的方法。
根据本发明的又一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810942615.4/2.html,转载请声明来源钻瓜专利网。