[发明专利]一种基于海量文献信息的可视化分析系统及其方法在审
申请号: | 201711411611.5 | 申请日: | 2017-12-23 |
公开(公告)号: | CN108170761A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 虞扬 | 申请(专利权)人: | 合肥弹刚信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 胡剑辉 |
地址: | 230000 安徽省合肥市经济技*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于海量文献信息的可视化分析系统,包括数据获取模块、数据临时存储库、数据处理模块、可视化分析数据库和可视化分析模块;数据获取模块包括爬取单元、分类单元以及查询标记单元;数据临时存储库用于存储经查询、标记后的文献信息;数据处理模块用于将数据临时存储库中的文献信息进行扫描,并对扫描后的文献信息进行处理、分析;可视化分析数据库根据关联度分析的结果进行可视化分析,为用户输出可视化分析结果。本发明通过对海量文献信息进行采集、分类和标记,并将文献信息中的关键词与输入关键词进行关联度分析,为可视化分析提供可靠的参考依据,便于对海量文献信息进行有效的整理,实现可视化分析,为用户提供决策。 1 | ||
搜索关键词: | 文献信息 可视化 数据临时存储 可视化分析系统 数据处理模块 数据获取模块 分析数据库 关联度分析 分析 扫描 分类和标记 输入关键词 查询 标记单元 参考依据 分类单元 分析模块 用户输出 用户提供 存储 采集 决策 | ||
所述数据获取模块包括爬取单元、分类单元以及查询标记单元,爬取单元用于对数据源中的海量文献信息进行采集,并将采集的海量文献信息发送至分类单元;
所述分类单元用于对采集的海量文献信息按照行业类别的不同进行划分;
所述查询标记单元用于输入关键词对文献信息进行查询,并对查询后的文献信息进行标记;
所述数据临时存储库用于存储经查询、标记后的文献信息;
所述数据处理模块用于将数据临时存储库中的文献信息进行扫描,并对扫描后的文献信息进行处理、分析;
所述可视化分析数据库用于存储数据处理模块分析后的文献信息,根据关联度分析的结果进行可视化分析,为用户输出可视化分析结果。
2.根据权利要求1所述的一种基于海量文献信息的可视化分析系统,其特征在于:所述数据处理模块包括信息扫描单元、数据预处理单元和关联度分析单元;所述信息扫描单元用于读取数据临时存储库中的文献信息;
所述数据预处理单元用于对读取的文献信息中的内容进行数据清洗,以提取文献中的关键词;
所述关联度分析单元用于将提取的关键词与输入的关键词进行关联度分析。
3.一种基于海量文献信息的可视化分析方法,其特征在于,包括以下步骤:S1、对数据源中的海量文献信息进行采集,并将采集的海量文献信息按照领域不同划分为若干行业类别,并提取行业类别中文献信息的关键词;
S2、在行业类别中输入若干关键词对海量文献信息进行查询,对查询的结果进行标记,并将标记后的文献信息存储至数据临时存储库;
S3、对数据临时存储库中的文献信息进行扫描,并将扫描后的结果发送至数据预处理;
S4、将经数据预处理提取的所有关键词与输入的关键词进行关联度分析,标记关联度数值,并将分析后的文献信息存储至可视化分析数据库;
S5、获取可视化分析数据库中存储的文献信息,进行可视化分析,绘制关联度相关表,为用户输出可视化分析结果。
4.根据权利要求3所述的一种基于海量文献信息的可视化分析方法,其特征在于:所述步骤S4中经数据预处理提取的所有关键词A[m]={a1,a2,...,am},所述步骤S2中输入的关键词B[n]={b1,b2,...,bn},并将输入的每个关键词分别与每个文献信息中的每个关键词进行一一对比,关联度数值该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥弹刚信息科技有限公司,未经合肥弹刚信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711411611.5/,转载请声明来源钻瓜专利网。
- 上一篇:智能硬件管理系统和设备
- 下一篇:基于Kinect的图像检索方法