[发明专利]一种企业业务分类编码方法、装置、设备及可读存储介质有效
申请号: | 202210371122.6 | 申请日: | 2022-04-11 |
公开(公告)号: | CN114444504B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 刘思婧;王鸿鉴;李国旗;刘强;吴博文 | 申请(专利权)人: | 西南交通大学;四川自由贸易试验区通域园区运营有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/247;G06N3/04;G06N3/08 |
代理公司: | 北京集智东方知识产权代理有限公司 11578 | 代理人: | 刘林;陈攀 |
地址: | 610031 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 企业 业务 分类 编码 方法 装置 设备 可读 存储 介质 | ||
本发明提供了一种企业业务分类编码方法、装置、设备及可读存储介质,涉及计算机技术领域,包括获取至少一个待分类企业的信息和数据集;对数据集内所有的经营范围进行编号并扩展向量化得到每个经营范围对应的向量数据集;建立基于深度学习算法的两级分类编码数学模型,并根据向量数据集训练两级分类编码数学模型;将所有待分类企业的企业经营范围向量化后输入到两级分类编码数学模型,并求解模型得到每个待分类企业的业务对应的编号,本发明通过获取得到经营范围通过三种不同向量方式表示,其目的在于充分提取文本特征并改变现有技术中仅单一向量表示而可能忽略词语在不同位置的含义区别,更能解决文本中差异化用语习惯给文本含义带来的影响。
技术领域
本发明涉及计算机技术领域,具体而言,涉及企业业务分类编码方法、装置、设备及可读存储介质。
背景技术
目前,我国企业的经营业务存在大量重复、相似以及错误等信息,若是想面对企业进行研究,通过现有企业经营业务数据判断企业所属行业是具有偏差的,因此经营业务数据亟待进行标准化以提升数据质量,并让政府部门更便于管理和维护,但是现有算法尚未有一种能对企业经营业务进行自动化分类并编码。
发明内容
本发明的目的在于提供一种企业业务分类编码方法、装置、设备及可读存储介质,以改善上述问题。为了实现上述目的,本发明采取的技术方案如下:
第一方面,本申请提供了一种企业业务分类编码方法,包括:获取至少一个待分类企业的信息和数据集,所述待分类企业的信息包括待分类企业名称和待分类企业经营范围,所述数据集包括至少两条企业经营范围;对所述数据集内所有的所述经营范围进行编号并扩展向量化得到每个所述经营范围对应的向量数据集,所述向量数据集包括的第一文本向量、第二文本向量、第三文本向量和编号;建立基于深度学习算法的两级分类编码数学模型,并根据所述向量数据集训练所述两级分类编码数学模型;将所有所述待分类企业的待分类企业经营范围向量化后输入到所述两级分类编码数学模型,并求解所述两级分类编码数学模型得到每个所述待分类企业的业务对应的编号。
第二方面,本申请还提供了一种企业业务分类编码装置,包括:获取单元,用于获取至少一个待分类企业的信息和数据集,所述待分类企业的信息包括待分类企业名称和待分类企业经营范围,所述数据集包括至少两条企业经营范围;预处理单元,用于对所述数据集内所有的所述经营范围进行编号并扩展向量化得到每个所述经营范围对应的向量数据集,所述向量数据集包括的第一文本向量、第二文本向量、第三文本向量和编号;模型建立单元,用于建立基于深度学习算法的两级分类编码数学模型,并根据所述向量数据集训练所述两级分类编码数学模型;企业业务分类单元,用于将所有所述待分类企业的待分类企业经营范围向量化后输入到所述两级分类编码数学模型,并求解所述两级分类编码数学模型得到每个所述待分类企业的业务对应的编号。
第三方面,本申请还提供了一种企业业务分类编码设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现所述企业业务分类编码方法的步骤。
第四方面,本申请还提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于企业业务分类编码方法的步骤。
本发明的有益效果为:
本发明通过获取得到的企业信息中的经营范围通过三种不同的向量方式表示,其目的在于改变现有技术中仅仅通过单一的向量表示方法而无法充分提取文本特征以及并且可能忽略了一些词语在不同位置的含义区别,通过采用三种文本向量表示的方法,最大的解决文本中差异化用语习惯给文本含义带来的影响,依次达到提升在神经网络在文本特征时的效果,提升本方法整体的泛化性和鲁棒性。
本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学;四川自由贸易试验区通域园区运营有限公司,未经西南交通大学;四川自由贸易试验区通域园区运营有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210371122.6/2.html,转载请声明来源钻瓜专利网。