[发明专利]基于自动信息筛选的企业行业分类系统在审

专利信息
申请号: 201611270135.5 申请日: 2016-12-31
公开(公告)号: CN106779467A 公开(公告)日: 2017-05-31
发明(设计)人: 蒋欣辰;刘世林 申请(专利权)人: 成都数联铭品科技有限公司
主分类号: G06Q10/06 分类号: G06Q10/06;G06F17/30;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 610041 四川省成都市高新区*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 自动 信息 筛选 企业 行业 分类 系统
【权利要求书】:

1.基于自动信息筛选的企业行业分类系统,其特征在于,所述系统包含行业分类神经网络模型;所述行业分类神经网络模型中结合循环神经网络和门限控制的方法,使用企业名称来对企业经营范围信息进行筛选,实现对待分类企业二级行业的自动分类判断。

2.如权利要求1所述的系统,其特征在于,采用的所述行业分类神经网络模型的向前算法公式如下:

hj=GRU1(xj,hj-1)

sj=GRU2(zj,sj-1)

f=σ(W(f)hT+U(f)sT)

y=softmax(b)

其中,GRU1为第一循环神经网络,hj是GRU1在输入序列中第j个词的输入后生成的隐藏层状态向量,xj是输入序列中第j个词的词向量;

GRU2为第二循环神经网络;sj是GRU2在输入序列中第j个词的输入后生成的隐藏层状态向量,zj是输入序列中第j个词的词向量;

f是用于信息筛选的控制门向量,hT是最后一个词输入后生成的隐藏层状态向量,sT是最后一个词输入后生成的隐藏层状态向量,f由hT和sT通过一个全连接的神经网络生成,其网络的参数分别是W(f)和U(f),激活函数是sigmoid函数,由符号σ表示;

b是另一个全连接的神经网络得到的预测向量,该全连接神经网络的输入向量为sT、f和hT,激活函数为tanh,由完成信息筛选,W为sT的参数,U为的参数;

y为通过本神经网络的最终的每个类别的分类概率分布向量,由向量b通过一个softmax层得到。

3.如权利要求1所述的系统,其特征在于,包含以下实现步骤:

(1)将待分类企业的企业名称和经营范围进行分词处理,将分词后的数据作为语料库生成词汇表,并对每一个词建立相应的词典索引,将索引值映射成不同的固定长度的随机向量;

(2)将二级行业分类中的所有类别进行编码,并将编码号转化成对应的向量,一个编码号对应一个向量;

(3)在待分类企业中随机选取一定数量的样本,进行标注;在标注后中样划分为训练样本和开发样本;

(4)将训练样本的二级行业分类向量、企业经营范围的词向量序列和企业名称的词向量序列输入行业分类神经网络模型中,通过神经网络的向前算法和误差反向传播,自动调节神经网络的权重参数,直到模型收敛;

(5)将待分类企业的企业经营范围的词向量序列输入已经训练完毕的所述行业分类神经网络模型的第一循环神经网络中,将对应企业名称的词向量序列输入已经训练完毕的所述行业分类神经网络模型的第二循环神经网络中;通过所述行业分类神经网络预测出待分类企业的二级行业分类结果。

4.如权利要求3所述的系统,其特征在于,所述行业分类神经网络模型的向前传播包含以下实现过程:

①、将待分类企业经营范围的词向量序列输入GRU1,生成表征经营范围的向量;

②、将待分类企业名称的词向量序列输入GRU2,生成表征企业名的向量;

③、将表征经营范围的向量和表征公司名的向量送入全连接的神经网络生成信息筛选门控制向量;

④、通过信息筛选门控制向量过滤表征经营范围的向量生成筛选后的经营范围向量;

⑤、将筛选后的经营范围向量和表征公司名的向量送入全连接的神经网络生成预测向量,再通过softmax层生成二级行业类别的概率分布。

5.如权利要求4所述的系统,其特征在于,所述步骤(1)和步骤(2)的顺序可以调换。

6.如权利要求5所述的系统,其特征在于,所述系统为加载有如权利要求1至5之一所述企业行业分类功能程序的计算机或者服务器。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数联铭品科技有限公司,未经成都数联铭品科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611270135.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top