[发明专利]一种网络社交媒体观点倾向性分析系统及方法在审
申请号: | 201710160543.3 | 申请日: | 2017-03-17 |
公开(公告)号: | CN106951409A | 公开(公告)日: | 2017-07-14 |
发明(设计)人: | 王春华;韩栋;韩枫;李峰;曾步衢 | 申请(专利权)人: | 黄淮学院 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06Q50/00 |
代理公司: | 北京爱普纳杰专利代理事务所(特殊普通合伙)11419 | 代理人: | 王玉松 |
地址: | 463000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 社交 媒体 观点 倾向性 分析 系统 方法 | ||
技术领域
本发明涉及网络信息处理技术领域,特别涉及一种网络社交媒体观点倾向性分析系统及方法。
背景技术
互联网已成为人们获取和交流信息的最重要的平台之一,互联网与传统媒体相比,最大的特点之一是自由、开放、及时,任何人都可以通过博客、论坛、微博、空间等在互联网上发布观点和评论。基于互联网的网络社交媒体,极大地方便了人们在互联网上对自己感兴趣的政策、新闻、社会事件、热点人物以及电商产品等发表观点和看法。网络社交媒体正在成为人类社会关系维系和信息传播的重要载体和渠道,对国家安全和社会发展产生了深远的影响。
目前,网络社交媒体中存在并持续产生着海量的观点评论信息,它们具有重要的应用价值,已受到了社会各方的特别关注。例如,政府能够通过公众评论信息,了解人们对各项政策措施和突发事件的情绪及态度,掌控舆情,从而及时地做出正确的决策,还可对特定的高压力人群做情感分析,从而给他们提供有针对性的心理疏导;企业可以通过对产品评论信息,掌握产品的市场反响,从而及时完善产品的性能或改变销售策略,提升其社会竞争力;大众能够通过商品的评价信息,了解产品各个方面的性能,参考其他消费者的使用体验,从而帮助自己做出购买决定。但是,网络社交媒体中的包含各种观点的信息正以指数级别的速度增长,具有信息量大、分散性强、随意性强、语句结构不完整等特点,使得大量有价值的观点信息被淹没。目前,虽然信息检索技术的发展在一定程度上缓解了这种信息过载带来的压力,但搜索引擎大多釆用关键字匹配,没有将观点和情感分析考虑进去。因此,对于一个简单的搜索,就可能返回大量包含重复和不相关内容的网页,用户需要耗费大量的时间和精力才能找到针对某事、某人、某物等的观点和情感倾向性信息,这与人们的实际需求还相距甚远,此外,每个人通常只能监控某几个互联网站点的文本信息,信息汇总困难,容易忽略某些热点信息。
为了能够实现对互联网舆情信息的快速分析和统计,现有专利公开号为CN104142913A公开了词语极性的判别方法和判别系统,该专利能够实现词语的情感倾向,但是分析过程较为复杂,情感倾向性分析准确度不高;同时,现有专利公开号为CN101408883A公开了一种网络舆情观点收集方法,其实现了观点收集,观点情感性判断很难适应网络社交媒体的多样性,不能满足用户对互联网舆情信息的情感倾向性分析,为此,急需开发一种能够快速统计互联网舆情信息,并能够判断出信息中观点的倾向性的网络社交媒体观点倾向性分析方法及系统。
发明内容
为了解决现有媒体观点分析和收集技术存在的分析过程较为复杂,情感倾向性分析准确度不高,观点情感性判断很难适应网络社交媒体的多样性,不能满足用户对互联网舆情信息的情感倾向性分析等问题,本发明提供了一种观点提取准确,而且能够快速分析观点的倾向性的网络社交媒体观点倾向性分析方法及系统。
本发明具体技术方案如下:
本发明提供了一种网络社交媒体观点倾向性分析系统,包括数据库及与所述数据库相通讯的网页抓取模块、观点采集模块、数据过滤模块、极性分析模块;所述数据库用于存储正向情感集群和负向情感集群,所述正向情感集群和所述负向情感集群内均存储有若干情感性字或词语,情感性字或词语包括形容词、动词、名词、副词;
所述网页抓取模块用于通过网页爬虫对网络社交媒体的评论交互网页进行抓取,所述网络社交媒体包括微博、微信、博客、论坛、播客、交易平台;
所述观点采集模块用于读取所述评论交互网页中用户评论的若干观点信息;
所述数据过滤模块用于对所述观点信息进行筛选,并将与所述网络社交媒体中评论主题无关的所述观点信息删除;
所述极性分析模块用于提取所述观点信息内的若干情感倾向性因子,所述情感倾向性因子为情感性字或词语,并将所述情感倾向性因子与所述正向情感集群和所述负向情感集群内的情感性字或词语进行匹配度判断,统计所述观点信息内的若干所述情感倾向性因子分别属于所述正向情感集群和所述负向情感集群的数量,通过数量对比分析出所述观点信息的情感倾向性,同时对所述观点信息赋予极性标签,所述极性标签包括正向情感信息和负向情感信息。
进一步的,所述数据过滤模块包括相通讯的主题因子提取单元、相关模型建设单元、关键字提取单元、相关度判断单元、过滤审核单元,
所述主题因子提取单元用于提取所述评论交互网页中与所述评论主题相关的若干关键因子,所述关键因子包括所述评论主题中的关键字、用于评论所述评论主题的形容词;
所述相关模型建设单元用于将若干所述关键因子作为为训练样本对卷积神经网络模型进行训练,建立相关度模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黄淮学院,未经黄淮学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710160543.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种小型移动式搅拌机
- 下一篇:一种水性涂料液体混合搅拌装置