[发明专利]一种多标签融合的主题库建设方法在审

专利信息
申请号: 202010798218.1 申请日: 2020-08-10
公开(公告)号: CN111913992A 公开(公告)日: 2020-11-10
发明(设计)人: 杨勤;宋设;祖佳征 申请(专利权)人: 浪潮卓数大数据产业发展有限公司
主分类号: G06F16/2455 分类号: G06F16/2455;G06F16/242;G06F16/9032;G06F16/9035;G06F16/906
代理公司: 济南信达专利事务所有限公司 37100 代理人: 冯春连
地址: 214029 江苏省无锡市滨*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 标签 融合 主题 建设 方法
【说明书】:

发明公开一种多标签融合的主题库建设方法,涉及数据处理技术领域,该方法基于标签规则配置组件、搜索筛选组件、主题库导出组件,其过程包括:首先,标签规则配置组件,一方面将数据按照一定的逻辑配置相应的规则,并给符合规则的数据打上相应的标签,另一方面,对数据配置规则这一过程进行执行和管控;其次,搜索筛选组件对打过标签的数据进行查询和筛选,得到符合要求数据结果;最后,主题库导出组件从搜索筛选组件得到的数据结果中进行选择,并将选中数据结果导出,随后存储于主题库。本发明将打标签的数据存储在主题库,实现数据的细致分类,使得导出的数据可以直接进行使用。

技术领域

本发明涉及数据处理技术领域,具体的说是一种多标签融合的主题库建设方法。

背景技术

为了便于运营监测分析业务的开展,研发人员计划根据电力公司的运营目标、业务职能以及业务能力,并基于可参考的流程层级建设理论,对电力公司运营监测主题库的架构进行详细设计,形成从公司运营目标到业务职能、业务能力、业务环节、指标/核心数据等五层级的关联网,为电力公司运营监测主题库的架构设计提供参考依据。但是,由于现在数据量大、数据结构并不是那么统一和整齐,尚无法对据的筛选、统一和对整体数据进行细分。

发明内容

本发明针对现有数据仓库常规建设思路下,结合当下数据量大、数据结构复杂的特点,提供一种多标签融合的主题库建设方法,旨在针对各种类型的数据,进行数据标签规则的配置和查询导出,筛选出跟实际业务更贴合的细分数据。

本发明的一种多标签融合的主题库建设方法,解决上述技术问题采用的技术方案如下:

一种多标签融合的主题库建设方法,该方法基于标签规则配置组件、搜索筛选组件、主题库导出组件,其过程包括:

首先,标签规则配置组件,一方面将数据按照一定的逻辑配置相应的规则,并给符合规则的数据打上相应的标签,另一方面,对数据配置规则这一过程进行执行和管控;

其次,搜索筛选组件对打过标签的数据进行查询和筛选,得到符合要求数据结果;

最后,主题库导出组件从搜索筛选组件得到的数据结果中进行选择,并将选中数据结果导出,随后存储于主题库。

可选的,一条数据包含多个值,标签规则配置组件按照配置的规则将任一条数据的第N个值定义为指标,其中,N表示任一自然数,随后把所有数据中定义为指标的第N个值的聚合值定义为变量,最后根据指标和变量的关系确定相应的标签。

进一步可选的,一条数据多个值根据配置的规则进行定义后,可以确定至少一个标签,且一条数据确定的标签数小于该条数据所包含的值数。

进一步可选的,搜索筛选组件可以选择至少一个标签作为关键词对所有数据进行查询和筛选,主题库导出组件将根据不同关键词数量筛选得到的数据结果存储于不同的主题库单元,多个主题库单元同属于一个主题库。

优选的,主题库的名称可以依据数据的描述人群和关键词进行命名。

进一步可选的,一个主题库包括多个主题子库,每个主题子库包括多个主题库单元,相同类型的一组数据结果根据关键词存储于同一个主题子库的不同主题单元,不同类型的一组数据结果根据关键词存储于不同的主题子库。

进一步可选的,主题库导出组件将选中数据结果导出并存储于主题库之前,可以预先在主题库导出组件中设置被选中数据的导出路径、存储方式、数据注释、获取方式。

进一步的,一种多标签融合的主题库建设方法还基于定时执行组件,

定时执行组件中设定有间隔时间,定时执行组件根据设定的间隔时间依次执行下述过程:

将标签规则配置组件配置的规则及与规则相对应的标签导出至搜索筛选组件进行更新,

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮卓数大数据产业发展有限公司,未经浪潮卓数大数据产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010798218.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top