[发明专利]健康舆情监测方法与系统在审
申请号: | 201810583094.8 | 申请日: | 2018-06-08 |
公开(公告)号: | CN108829811A | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 陈雷霆;李巧平;陈秋生;陈雅琳;徐安;刘薇;陈淑珠 | 申请(专利权)人: | 东莞迪赛软件技术有限公司;电子科技大学广东电子信息工程研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京汇捷知识产权代理事务所(普通合伙) 11531 | 代理人: | 李宏伟 |
地址: | 523000 广东省东莞市松山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种健康舆情监测方法与系统,涉及信息技术领域,该健康舆情监测方法与系统针对医疗健康行业的特点,提出了一种面向医疗健康行业的舆情监测方法,通过对舆情本身进行分析,统计评论的情感极性、热度,计算舆情的预警等级,针对不同等级采用不同的处理方式,有针对性的对医疗健康行业的舆情进行监测,提高医疗健康行业的舆情分析分析效率。该健康舆情监测方法与系统有针对性的对医疗健康行业进行舆情监测;提高了医疗健康领域的舆情分析效率;增加了医疗健康领域舆情分析的多样性。 | ||
搜索关键词: | 医疗健康 监测 舆情分析 健康 信息技术领域 处理方式 分析效率 情感极性 热度 多样性 预警 评论 统计 分析 | ||
【主权项】:
1.一种健康舆情监测方法与系统,其特征在于:所述健康舆情监测方法与系统包括支持PB级的数据存储与高效处理、面向医疗卫生行业的健康数据垂直深度爬取、健康大数据智能分析,其中:(1)支持PB级的数据存储与高效处理:医疗健康数据有些是结构化的,而医学影像、报表、日志等数据的是半结构化或非结构化数据,对于结构化大数据,适于采用Hive数据仓库,对于数据结构字段不够确定或杂乱无章很难按一个概念去进行抽取的大数据适合用HBase,搭建Hadoop,利用HDFS,使用Hive和HBase管理大数据,使用高性能高容量存储服务器作为HDFS的DataNode,总容量可达到PB数量级,主节点NameNode则使用128GB高内存服务器,集群内网使用千兆网卡与连接线,保证节点之间的数据传输速率;(2)面向医疗卫生行业的健康数据垂直深度爬取方案:根据Hadoop架构,实现分布式爬虫技术和布隆过滤去重技术,这部分主要由3个部分构成:数据采集模块,融合分析模块和快速索引模块,首先,信息采集模块从网络上抓取HTML文件,并将下载的文件保存到Hadoop的HDFS中,然后经过网页分析,并消除重复抓取的网页,接着,根据分析模块所提供的分词功能,将抓取的内容进行分次处理,并将分词后的词元序列给索引模块,索引模块根据抓取文本的分词结果进行倒排索引,并将索引存入Hadoop分布式文件系统上的索引库中供上层居民健康智能服务使用和访问;(3)健康大数据智能分析:针对爬取到的健康大数据进行智能分析,给出分析结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞迪赛软件技术有限公司;电子科技大学广东电子信息工程研究院,未经东莞迪赛软件技术有限公司;电子科技大学广东电子信息工程研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810583094.8/,转载请声明来源钻瓜专利网。
- 上一篇:面向健康舆情的文本分类方法
- 下一篇:基于深度学习的云物体库构建方法