[发明专利]基于nlp分类模型智能下发的方法、装置以及存储介质在审
申请号: | 202110702962.1 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113377715A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 张迎泽;喻波;王志海;韩振国 | 申请(专利权)人: | 北京明朝万达科技股份有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06F16/176 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100142 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 nlp 分类 模型 智能 下发 方法 装置 以及 存储 介质 | ||
本发明提供一种基于nlp分类模型智能下发的方法、装置以及存储介质。其中所述方法包括:将业务系统和nlp训练服务系统的样本文件和模型文件存放路径做共享;业务系统导入和解析所述样本文件,并将解析后的样本文件的路径发送给nlp训练服务系统,nlp训练服务系统生成智慧模型文件;业务系统将智慧模型文件发送给nlp预测系统,并重新加载nlp预测系统的预测服务,使最新下发的智慧模型生效;通过调用所述预测服务的预测接口对外部文件进行分类。
技术领域
本发明涉及文档智能分类分级技术领域,尤其是涉及一种基于nlp分类模型智能下发的方法、装置以及存储介质。
背景技术
自然语言处理(NLP)是一种专业分析人类语言的人工智能,融合了语言学、计算机科学和机器学习的混合学科,支持文本实体抽取、文本分类、关键短语抽取、情感分析、关系抽取、商品评价解析,简历抽取和智能合同审查等NLP定制化算法能力,用户无需拥有丰富的算法背景,仅需标注或上传适量文档数据,即可通过平台快速创建算法模型并使用。
公开号为CN110413769A公开了一种场景分类方法、装置以及存储介质。该场景分类方法包括对用户输入的文本进行预处理;基于扩展词库对经预处理的文本进行分词以生成语料;将语料转换为向量;以及使用卷积神经网络模型对向量进行处理以获得与文本对应的场景分类的概率针对nlp文档分类分级技术,目前市场上都是先通过收集样本文件,对样本文件进行训练后生成智慧模型,通过拷贝智慧模型到预测器从而预测文件类别,当样本文件积累到一定数量后再训练生成模型来不断提高模型准确率。
对于模型文件的拷贝、重启预测器加载模型的步骤对于客户来说操作起来会显得很繁琐,并且存在一定的安全隐患,为了提高客户的工作效率保障客户服务器环境的安全,有必要对处理流程进行优化。
发明内容
本发明的目的在于提供一种基于nlp分类模型智能下发的方法、装置以及存储介质,以解决现有技术中存在的技术问题。
本发明第一方面提供了一种基于nlp分类模型智能下发的方法,方法包括:
S1:将业务系统和nlp训练服务系统的样本文件和模型文件存放路径做共享;
S2:业务系统导入和解析所述样本文件,并将解析后的样本文件的路径发送给nlp训练服务系统,nlp训练服务系统生成智慧模型文件;
S3:业务系统将智慧模型文件发送给nlp预测系统,并重新加载nlp预测系统的预测服务,使最新下发的智慧模型生效。
根据本发明第一方面提供的方法,所述方法还包括:
S4:通过调用所述预测服务的预测接口对外部文件进行分类。
根据本发明第一方面提供的方法,所述路径做共享的方法为:nas存储。
根据本发明第一方面提供的方法,所述解析所述样本文件的方法为:tika文本解析工具。
根据本发明第一方面提供的方法,调用tika将所述样本文件解析为txt文本文件。
根据本发明第一方面提供的方法,nlp训练服务系统通过路径共享的方式得到所述txt文本文件。
根据本发明第一方面提供的方法,所述业务系统将智慧模型文件发送给nlp预测系统之前,所述方法还包括:所述业务系统通过路径共享的方式从nlp训练服务系统得到所述智慧模型文件。
根据本发明第一方面提供的方法,所述将智慧模型文件发送给nlp预测系统的方法为:thrift文件流方式。
本发明第二方面提供了一种基于nlp分类模型智能下发的装置,装置包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明朝万达科技股份有限公司,未经北京明朝万达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110702962.1/2.html,转载请声明来源钻瓜专利网。