[发明专利]一种用于设置企业特性标签的方法及其系统在审
申请号: | 201710355321.7 | 申请日: | 2017-05-19 |
公开(公告)号: | CN107193936A | 公开(公告)日: | 2017-09-22 |
发明(设计)人: | 李小强 | 申请(专利权)人: | 前海梧桐(深圳)数据有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 深圳市精英专利事务所44242 | 代理人: | 冯筠 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 设置 企业 特性 标签 方法 及其 系统 | ||
技术领域
本发明涉及企业经营体系,更具体地说是指一种用于设置企业特性标签的方法及其系统。
背景技术
企业数据泛指所有与企业经营相关的信息、资料,包括公司概况、产品信息、经营数据、研究成果等,其中不乏涉及商业机密。通常所说的企业数据是指狭义的企业数据,一般只包含公司概况介绍,包括公司经营范围、联系方式、企业规模等,通常是公开的数据。
这些企业公开数据一般放置在互联网上,重复采用通识标签对这些数据进行标识,以达到对企业结构化信息的简单分类汇总,并没有对有价值的非结构化的企业网络数据进行体系化的挖掘分析并设置企业特性标签,以此精炼呈现企业特性,无法自动对冗余信息进行过滤,也无法准确得知企业的特性以及价值。
因此,有必要设计一种用于设置企业特性标签的方法,实现自动过滤冗杂无效的企业信息,对有价值的非结构化的企业网络信息进行体系化的挖掘分析辅助用户对企业进行价值判断,准确得知企业的特性以及价值,直观又快速。
发明内容
本发明的目的在于克服现有技术的缺陷,提供一种用于设置企业特性标签的方法及其系统。
为实现上述目的,本发明采用以下技术方案:一种用于设置企业特性标签的方法,所述方法包括:
建立多维度企业特性标签指标体系;
根据多维度企业特性标签指标体系,获取语料库;
收集海量企业信息,提取标准化表达方式;
将所述标准表达方式与语料库进行匹配,确定企业特性标签。
其进一步技术方案为:根据多维度企业特性标签指标体系,获取语料库的步骤,包括以下具体步骤:
根据多维度企业特性标签指标体系,提炼企业特性标签的标准化表达方式;
根据多维度企业特性标签指标体系,对支撑企业特性标签的非标准化网络信息提取标准化表达方式;
将企业特性标签的标准化表达方式以及非标准化网络信息提取标准化表达方式组成语料库。
其进一步技术方案为:收集海量企业信息,提取标准化表达方式的步骤,包括以下具体步骤:
收集海量企业信息,进行分析处理;
筛选所述海量企业信息内与多维度企业特性标签指标体系相关联的各个特性的样本企业信息;
对所述样本企业信息提取标准化表达方式。
其进一步技术方案为:收集海量企业信息,进行分析处理的步骤,包括以下具体步骤:
利用企业全名、企业简称、产品名称采集相关咨讯网站的海量企业信息;
对采集所述海量企业信息进行清洗、归类、提取摘要、提取关键字、分词法以及语义分析。
其进一步技术方案为:对所述样本企业信息提取标准化表达方式的步骤,包括以下具体步骤:
根据语料库的分类,对所述样本企业信息进行分类汇总;
将所述样本企业信息经过格式化数据处理和标准化表述,形成标准表达方式。
本发明还提供了一种用于设置企业特性标签的系统,包括体系建立单元、语料库获取单元、提取单元以及匹配确定单元;
所述体系建立单元,用于建立多维度企业特性标签指标体系;
所述语料库获取单元,用于根据多维度企业特性标签指标体系,获取语料库;
所述提取单元,用于收集海量企业信息,提取标准化表达方式;
所述匹配确定单元,用于将所述标准表达方式与语料库进行匹配,确定企业特性标签。
其进一步技术方案为:所述语料库获取单元包括标准化提炼模块、非标准化提炼模块以及组合模块;
所述标准化提炼模块,用于根据多维度企业特性标签指标体系,提炼企业特性标签的标准化表达方式;
所述非标准化提炼模块,用于根据多维度企业特性标签指标体系,对支撑企业特性标签的非标准化网络信息提取标准化表达方式;
所述组合模块,用于将企业特性标签的标准化表达方式以及非标准化网络信息提取标准化表达方式组成语料库。
其进一步技术方案为:所述提取单元包括收集分析模块、筛选模块以及信息提炼模块;
所述收集分析模块,用于收集海量企业信息,进行分析处理;
所述筛选模块,用于筛选所述海量企业信息内与多维度企业特性标签指标体系相关联的各个特性的样本企业信息;
所述信息提炼模块,用于对所述样本企业信息提取标准化表达方式。
其进一步技术方案为:所述收集分析模块包括采集子模块以及分析处理子模块;
所述采集子模块,用于利用企业全名、企业简称、产品名称采集相关咨讯网站的海量企业信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于前海梧桐(深圳)数据有限公司,未经前海梧桐(深圳)数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710355321.7/2.html,转载请声明来源钻瓜专利网。