[发明专利]一种基于自然语言处理的智能打标签方法及系统在审
| 申请号: | 202111136132.3 | 申请日: | 2021-09-27 |
| 公开(公告)号: | CN113836304A | 公开(公告)日: | 2021-12-24 |
| 发明(设计)人: | 李钊;卢凤;孙静蕾;李欣欣;孙露;孙浩 | 申请(专利权)人: | 山东亿云信息技术有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/117;G06F40/289;G06K9/62;G06N3/04 |
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
| 地址: | 250014 山东省济南市*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 自然语言 处理 智能 标签 方法 系统 | ||
本发明公开了一种基于自然语言处理的智能打标签方法及系统,包括:构建训练集和测试集;基于训练集和测试集,构建标签模型;其中,所述训练集和测试集,均为已知标签的多个字段文本;对已经构建的标签模型进行封装,生成接口;对接口进行配置;获取待处理的文本数据;调用配置,对待处理的自然语言进行打标签处理。本发明的实施使得文本打标签任务实现了模型构建、测试、上线、执行及文本打标签全流程的自动化,大大提高了工作效率,节省公司的人力成本,同时经验证,该发明也取得较高的准确率。
技术领域
本发明涉及智能标签技术领域,特别是涉及一种基于自然语言处理的智能打标签方法及系统。
背景技术
本部分的陈述仅仅是提到了与本发明相关的背景技术,并不必然构成现有技术。
大数据时代文本信息数据大量涌现,越来越多的文本数据进入存储数据库进行统一保存,那么如何对数据库中的海量文本数据进行统一管理、标签化是当下需要重点解决的问题。但是现有文本标签化方法大多集中在仅处理单一字段文本内容,没有实现对数据库中所有字段文本信息标签化完整流程的构建,同时也缺少对文本标签任务的闭环管理。因此,需要结合文本标签任务实际应用场景,构建自动化文本标签化方法对海量文本进行标签化处理,同时实现文本标签任务的闭环是该任务的核心问题。
发明内容
为了解决现有技术的不足,本发明提供了一种基于自然语言处理的智能打标签方法及系统;首先构建数据库文本打标签任务流程,然后构建基于自然语言处理的文本标签处理模型,将数据库中待处理文本数据选择对应模型匹配完成标签任务创建,最后根据任务执行规则自动进行文本智能标签化。从而完成采用基于自然语言处理实现对数据库中文本信息数据智能打标签的工作。
第一方面,本发明提供了一种基于自然语言处理的智能打标签方法;
一种基于自然语言处理的智能打标签方法,包括:
构建训练集和测试集;基于训练集和测试集,构建标签模型;其中,所述训练集和测试集,均为已知标签的多个字段文本;
对已经构建的标签模型进行封装,生成接口;
对接口进行配置;
获取待处理的文本数据;调用配置,对待处理的自然语言进行打标签处理。
第二方面,本发明提供了一种基于自然语言处理的智能打标签系统;
一种基于自然语言处理的智能打标签系统,包括:
构建模块,其被配置为:构建训练集和测试集;基于训练集和测试集,构建标签模型;其中,所述训练集和测试集,均为已知标签的多个字段文本;
封装模块,其被配置为:对已经构建的标签模型进行封装,生成接口;
配置模块,其被配置为:对接口进行配置;
打标签模块,其被配置为:获取待处理的文本数据;调用配置,对待处理的自然语言进行打标签处理。
第三方面,本发明还提供了一种电子设备,包括:
存储器,用于非暂时性存储计算机可读指令;以及
处理器,用于运行所述计算机可读指令,
其中,所述计算机可读指令被所述处理器运行时,执行上述第一方面所述的方法。
第四方面,本发明还提供了一种存储介质,非暂时性地存储计算机可读指令,其中,当所述非暂时性计算机可读指令由计算机执行时,执行第一方面所述方法的指令。
与现有技术相比,本发明的有益效果是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东亿云信息技术有限公司,未经山东亿云信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111136132.3/2.html,转载请声明来源钻瓜专利网。





