[发明专利]一种企业业务分类编码方法、装置、设备及可读存储介质有效

专利信息
申请号: 202210371122.6 申请日: 2022-04-11
公开(公告)号: CN114444504B 公开(公告)日: 2022-08-05
发明(设计)人: 刘思婧;王鸿鉴;李国旗;刘强;吴博文 申请(专利权)人: 西南交通大学;四川自由贸易试验区通域园区运营有限公司
主分类号: G06F40/289 分类号: G06F40/289;G06F40/247;G06N3/04;G06N3/08
代理公司: 北京集智东方知识产权代理有限公司 11578 代理人: 刘林;陈攀
地址: 610031 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 企业 业务 分类 编码 方法 装置 设备 可读 存储 介质
【权利要求书】:

1.一种企业业务分类编码方法,其特征在于,包括:

获取至少一个待分类企业的信息和数据集,所述待分类企业的信息包括待分类企业名称和待分类企业经营范围,所述数据集包括至少两条企业经营范围;

对所述数据集内所有的所述经营范围进行编号并扩展向量化得到每个所述经营范围对应的向量数据集,所述向量数据集包括的第一文本向量、第二文本向量、第三文本向量和编号,所述第一文本向量由TF-IDF算法提取得到,所述第二文本向量由Word2Vec数学模型提取得到,所述第三文本向量由BERT数学模型提取得到;

建立基于深度学习算法的两级分类编码数学模型,并根据所述向量数据集训练所述两级分类编码数学模型;

将所有所述待分类企业的待分类企业经营范围向量化后输入到所述两级分类编码数学模型,并求解所述两级分类编码数学模型得到每个所述待分类企业的业务对应的编号;

其中,所述对所述数据集内所有所述经营范围进行编号并扩展向量化得到每个所述经营范围对应的向量数据集,包括:

对所述经营范围进行拆分得到至少一条单一经营业务;

根据预设规则对每个所述单一经营业务进行编号;

对每个所述单一经营业务进行语义扩展得到至少一个扩展文本,其中,所述语义扩展包括同义词替换和语序颠倒操作;

对每个所述单一经营业务和每个所述扩展文本均进行数据清洗并向量化为向量数据集;

其中,语序颠倒操作包括:

对单一经营业务进行分词并进行词性标注得到第一信息,第一信息包括单一经营业务内的至少两个分词和每个分词对应的词性;

对每个分词的词性进行遍历并判断是否存在双重词性并判断分词的词性,若分词的词性为双重词性并且在分词在单一经营业务内的词性为动词,则颠倒分词与第一词组的顺序并作为一个扩展文本,第一词组与分词相接并位于分词后方;

若分词的词性为双重词性并且在分词在单一经营业务内的词性为名词,则颠倒分词与第二词组的顺序并作为一个扩展文本,第二词组与分词相接并位于分词前方,第一词组和第二词组为名词组或形容词词组,名词组包括至少一个词性为名词的分词,形容词词组包括至少一个词性为形容词的分词;

其中,建立基于深度学习算法的两级分类编码数学模型,包括:

构建基于全连接神经网络的第一子分类器、构建基于双向长短时记忆神经网络的第二子分类器和构建基于卷积神经网络的第三子分类器,所述第一子分类器的输入信息为第一文本向量,所述第二子分类器的输入信息为第二文本向量,所述第三子分类器的输入信息为第三文本向量。

2.根据权利要求1所述的企业业务分类编码方法,其特征在于,所述对每个所述单一经营业务进行语义扩展得到至少一个扩展文本,包括:

对所述单一经营业务进行分词并进行词性标注得到第一信息,所述第一信息包括所述单一经营业务内的至少两个分词和每个所述分词对应的词性;

对所述第一信息内的所述分词进行语序颠倒扩展得到至少一个扩展文本。

3.根据权利要求1所述的企业业务分类编码方法,其特征在于,建立基于深度学习算法的两级分类编码数学模型,包括:

构建二级分类器,所述二级分类器包括依次连接的融合层和至少两个全连接层,每两个所述全连接层间设有dropout层,位于信息末端的全连接层作为输出层并由Softmax函数激活,其余全连接层由tanh函数激活,所述二级分类器的输入信息包括所述第一子分类器、所述第二子分类器和所述第三子分类器的输出信息,所述二级分类器的输出信息为企业的业务所对应的四位编码。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学;四川自由贸易试验区通域园区运营有限公司,未经西南交通大学;四川自由贸易试验区通域园区运营有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210371122.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top