[发明专利]行业分类模型训练、使用方法、装置、设备及介质在审
申请号: | 202011278739.0 | 申请日: | 2020-11-16 |
公开(公告)号: | CN112417150A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 罗奕康;聂砂;白彧斐;贾国琛;郑江 | 申请(专利权)人: | 建信金融科技有限责任公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 200120 上海市浦东新区中国(*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行业 分类 模型 训练 使用方法 装置 设备 介质 | ||
本发明实施例公开了一种行业分类模型的训练、使用方法、装置、设备及介质。所述方法包括:基于行业分类标准的层级关系,将各级分类行业向所属二级分类行业的行业分类标签进行映射,得到行业分类训练数据样本;采用行业分类训练数据样本以及所述行业分类训练数据样本中包括的行业分类标签,对预设行业分类模型进行有监督训练,得到目标行业分类模型。采用本申请方案,通过行业分类标准自带的层级关系来构建训练样本进行模型训练,可以实现不依赖任何标注数据,完成短文本、多标签文本的行业分类模型训练,且保证训练的模型能准确识别出公文短文本中的受众行业分类结果。
技术领域
本发明实施例涉及自然语音处理技术领域,尤其涉及一种行业分类模型的训练、使用方法、装置、设备及介质。
背景技术
随着经济的不断发展,针对各行各业推出了相应地慧企利民政策,在公布各种慧企利民政策后通常需要进行政策与个体、企业之间的匹配,实现精准推送政策,达到政策找人的目的。然而,相关技术中,通常是采用人工分类的方式对各类慧企利民政策进行行业匹配,虽然能够保证行业匹配的准确性,但是由于效率低下,缺乏实用性;如果采用传统机器学习的文本分类办法对政策进行分类,通常需要针对每一个行业标注大量数据,而政策公文文本往往伴随着数量少、文本包含分类多的特点,造成人工标注工作十分困难。因此,如何实现快速有效地对政策进行行业匹配变得尤为重要。
发明内容
本发明实施例中提供了一种行业分类模型的训练、使用方法、装置、设备及介质,以实现对各种公文政策快速准确地适配行业。
第一方面,本发明实施例中提供了一种行业分类模型的训练方法,所述方法包括:
基于行业分类标准的层级关系,将各级分类行业向所属二级分类行业的行业分类标签进行映射,得到行业分类训练数据样本;
采用行业分类训练数据样本以及所述行业分类训练数据样本中包括的行业分类标签,对预设行业分类模型进行有监督训练,得到目标行业分类模型。
第二方面,本发明实施例中还提供了一种行业分类模型的使用方法,所述行业分类模型采用本申请实施例中行业分类模型的训练方法获得,所述使用方法包括:
从公文文本信息中得到一组文本输入序列;
将所述一组文本输入序列输入到所述行业分类模型中,通过所述行业分类模型输出对应的CLS特征向量输出序列;
依据所述CLS特征向量输出序列,确定与所述公文文本信息匹配的二级行业分类结果。
第三方面,本发明实施例中还提供了一种行业分类模型的训练装置,所述装置包括:
样本获取模块,用于基于行业分类标准的层级关系,将各级分类行业向所属二级分类行业的行业分类标签进行映射,得到行业分类训练数据样本;
模型训练模块,用于采用行业分类训练数据样本以及所述行业分类训练数据样本中包括的行业分类标签,对预设行业分类模型进行有监督训练,得到目标行业分类模型。
第四方面,本发明实施例中还提供了一种行业分类模型的使用装置,其特征在于,所述行业分类模型采采用本申请实施例中行业分类模型的训练方法获得,所述装置包括:
输入模块,用于从公文文本信息中得到一组文本输入序列;
输出模块,用于将所述一组文本输入序列输入到所述行业分类模型中,通过所述行业分类模型输出对应的CLS特征向量输出序列;
分类模块,用于依据所述CLS特征向量输出序列,确定与所述公文文本信息匹配的二级行业分类结果。
第五方面,本发明实施例中还提供了一种电子设备,包括:
一个或多个处理装置;
存储装置,用于存储一个或多个程序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于建信金融科技有限责任公司,未经建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011278739.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:强化学习方法、装置、电子设备和存储介质
- 下一篇:一种干式智能管道压力检测仪