[发明专利]一种用于设置企业特性标签的方法及其系统在审
申请号: | 201710355321.7 | 申请日: | 2017-05-19 |
公开(公告)号: | CN107193936A | 公开(公告)日: | 2017-09-22 |
发明(设计)人: | 李小强 | 申请(专利权)人: | 前海梧桐(深圳)数据有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 深圳市精英专利事务所44242 | 代理人: | 冯筠 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 设置 企业 特性 标签 方法 及其 系统 | ||
1.一种用于设置企业特性标签的方法,其特征在于,所述方法包括:
建立多维度企业特性标签指标体系;
根据多维度企业特性标签指标体系,获取语料库;
收集海量企业信息,提取标准化表达方式;
将所述标准表达方式与语料库进行匹配,确定企业特性标签。
2.根据权利要求1所述的一种用于设置企业特性标签的方法,其特征在于,根据多维度企业特性标签指标体系,获取语料库的步骤,包括以下具体步骤:
根据多维度企业特性标签指标体系,提炼企业特性标签的标准化表达方式;
根据多维度企业特性标签指标体系,对支撑企业特性标签的非标准化网络信息提取标准化表达方式;
将企业特性标签的标准化表达方式以及非标准化网络信息提取标准化表达方式组成语料库。
3.根据权利要求2所述的一种用于设置企业特性标签的方法,其特征在于,收集海量企业信息,提取标准化表达方式的步骤,包括以下具体步骤:
收集海量企业信息,进行分析处理;
筛选所述海量企业信息内与多维度企业特性标签指标体系相关联的各个特性的样本企业信息;
对所述样本企业信息提取标准化表达方式。
4.根据权利要求3所述的一种用于设置企业特性标签的方法,其特征在于,收集海量企业信息,进行分析处理的步骤,包括以下具体步骤:
利用企业全名、企业简称、产品名称采集相关咨讯网站的海量企业信息;
对采集所述海量企业信息进行清洗、归类、提取摘要、提取关键字、分词法以及语义分析。
5.根据权利要求4所述的一种用于设置企业特性标签的方法,其特征在于,对所述样本企业信息提取标准化表达方式的步骤,包括以下具体步骤:
根据语料库的分类,对所述样本企业信息进行分类汇总;
将所述样本企业信息经过格式化数据处理和标准化表述,形成标准表达方式。
6.一种用于设置企业特性标签的系统,其特征在于,包括体系建立单元、语料库获取单元、提取单元以及匹配确定单元;
所述体系建立单元,用于建立多维度企业特性标签指标体系;
所述语料库获取单元,用于根据多维度企业特性标签指标体系,获取语料库;
所述提取单元,用于收集海量企业信息,提取标准化表达方式;
所述匹配确定单元,用于将所述标准表达方式与语料库进行匹配,确定企业特性标签。
7.根据权利要求6所述的一种用于设置企业特性标签的系统,其特征在于,所述语料库获取单元包括标准化提炼模块、非标准化提炼模块以及组合模块;
所述标准化提炼模块,用于根据多维度企业特性标签指标体系,提炼企业特性标签的标准化表达方式;
所述非标准化提炼模块,用于根据多维度企业特性标签指标体系,对支撑企业特性标签的非标准化网络信息提取标准化表达方式;
所述组合模块,用于将企业特性标签的标准化表达方式以及非标准化网络信息提取标准化表达方式组成语料库。
8.根据权利要求7所述的一种用于设置企业特性标签的系统,其特征在于,所述提取单元包括收集分析模块、筛选模块以及信息提炼模块;
所述收集分析模块,用于收集海量企业信息,进行分析处理;
所述筛选模块,用于筛选所述海量企业信息内与多维度企业特性标签指标体系相关联的各个特性的样本企业信息;
所述信息提炼模块,用于对所述样本企业信息提取标准化表达方式。
9.根据权利要求8所述的一种用于设置企业特性标签的系统,其特征在于,所述收集分析模块包括采集子模块以及分析处理子模块;
所述采集子模块,用于利用企业全名、企业简称、产品名称采集相关咨讯网站的海量企业信息;
所述分析处理子模块,用于对采集所述海量企业信息进行清洗、归类、提取摘要、提取关键字、分词法以及语义分析。
10.根据权利要求9所述的一种用于设置企业特性标签的系统,其特征在于,所述信息提炼模块包括分类汇总子模块以及表述子模块;
所述分类汇总子模块,用于根据语料库的分类,对所述样本企业信息进行分类汇总;
所述表述子模块,用于将所述样本企业信息经过格式化数据处理和标准化表述,形成标准表达方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于前海梧桐(深圳)数据有限公司,未经前海梧桐(深圳)数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710355321.7/1.html,转载请声明来源钻瓜专利网。