[发明专利]一种基于科技媒体云计算非结构化数据处理方法在审
申请号: | 201310399024.4 | 申请日: | 2013-09-05 |
公开(公告)号: | CN104424309A | 公开(公告)日: | 2015-03-18 |
发明(设计)人: | 渠继永 | 申请(专利权)人: | 清控科创控股股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市兰台律师事务所 11354 | 代理人: | 张峰 |
地址: | 100084 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于科技媒体云计算非结构化数据处理方法,主要由(1)进行科技媒体信息数据的获取;(2)根据不同类型的特征进行分布式云存储;(3)对步骤(2)中云存储的非结构化数据,调用后进行离线处理,离线处理包括:清洗、排重、关联、过滤、关键词提取和智能归类,然后将离线处理后的非结构化数据更新到云存储中。本发明定位在科技媒体的垂直领域的基于云计算的非结构化数据解决方案,由于对行业的精准定位,对常用关键词的深入分析,能够提高信息的精准度,同时能排除部分噪音词,提高数据处理的效率。 | ||
搜索关键词: | 一种 基于 科技 媒体 计算 结构 数据处理 方法 | ||
【主权项】:
一种基于科技媒体云计算非结构化数据处理方法,其特征在于,主要由以下步骤组成:(1)、进行科技媒体信息数据的获取,得到待处理的非结构化数据;(2)、对非结构化数据,根据不同类型的特征进行分布式云存储;(3)、对步骤(2)中云存储的非结构化数据,调用后进行离线处理,离线处理包括:清洗、排重、关联、过滤、关键词提取和智能归类,然后将离线处理后的非结构化数据更新到云存储中;(4)、根据非结构化数据的特征,对收到信息检索请求进行回应,检索结果序列按照非结构化数据的特征进行展示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清控科创控股股份有限公司,未经清控科创控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310399024.4/,转载请声明来源钻瓜专利网。
- 上一篇:对列状表数据库的数据库操作
- 下一篇:用于提供地点信息的方法和设备