[发明专利]基于弱监督技术主动学习的智能标注方法、装置及平台在审
申请号: | 201911127625.3 | 申请日: | 2019-11-18 |
公开(公告)号: | CN110968695A | 公开(公告)日: | 2020-04-07 |
发明(设计)人: | 罗彤;孙静静;陈国旗;王希治 | 申请(专利权)人: | 罗彤;北京融汇金信信息技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N20/00 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 苗晓静 |
地址: | 100036 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 技术 主动 学习 智能 标注 方法 装置 平台 | ||
1.一种基于弱监督技术主动学习的智能标注方法,其特征在于,包括:
获取待标注数据的标注方式,并根据所述标注方式对所述待标注数据进行数据标注,得到标注数据;
选择机器学习模型和对应的模型参数配置,根据所述模型参数配置和所述标注数据对所述机器学习模型进行训练;
若判断训练结果满足验证条件,则完成所述机器学习模型的训练;
其中,所述标注方法包括以下至少一种:标签分类方式、粗细粒度的情感识别方式、序列识别方式、结构化信息方式和序列生成方式;
所述序列识别方式包括以下至少一种:实体识别方式、分词识别方式和词性识别方式;
所述结构化信息方式包括以下至少一种:关系识别方式、句法分析方式、语义分析方式、事件抽取方式和多轮对话方式,所述多轮对话方式是具有上下文的结构化信息方式;
所述序列生成方式包括以下至少一种:机器翻译方式、文本摘要方式和文本生成方式。
2.根据权利要求1所述的基于弱监督技术主动学习的智能标注方法,其特征在于,所述获取待标注数据的标注方式,并根据所述标注方式对所述待标注数据进行数据标注,得到标注数据,具体包括:
若根据所述标注方式无法对所述待标注数据进行数据标注,则生成待标注提示信息,接收输入设备输入的标注信息,并根据所述标注信息得到标注数据。
3.根据权利要求1所述的基于弱监督技术主动学习的智能标注方法,其特征在于,所述根据所述结构化信息方式对所述待标注数据进行数据标注,具体包括:
根据所述标注方式进入语料集逐条对所述待标注数据进行数据标注;或,
根据所述标注方式选择远程监督和人工规则的弱监督学习方法对所述待标注数据进行非精确标注;或,
根据所述标注方式通过语料搜索对所述待标注数据进行数据标注。
4.根据权利要求1所述的基于弱监督技术主动学习的智能标注方法,其特征在于,所述获取待标注数据的标注方式,并根据所述标注方式对所述待标注数据进行数据标注,得到标注数据之前,还包括:
根据主动学习方法或者弱监督学习方法生成所述待标注数据。
5.根据权利要求1所述的基于弱监督技术主动学习的智能标注方法,其特征在于,所述若判断训练结果满足验证条件,则完成所述机器学习模型的训练之后,还包括:
根据所述训练结果和验证结果评估训练完成的机器学习模型的性能指标:
其中,所述性能指标包括:准确率和/或召回率。
6.一种基于弱监督技术主动学习的智能标注装置,其特征在于,包括:
数据标注模块,用于获取待标注数据的标注方式,并根据所述标注方式对所述待标注数据进行数据标注,得到标注数据;
模型训练模块,用于选择机器学习模型和对应的模型参数配置,根据所述模型参数配置和所述标注数据对所述机器学习模型进行训练;
结果验证模块,用于若判断训练结果满足验证条件,则完成所述机器学习模型的训练;
其中,所述标注方法包括以下至少一种:标签分类方式、粗细粒度的情感识别方式、序列识别方式、结构化信息方式和序列生成方式;
所述序列识别方式包括以下至少一种:实体识别方式、分词识别方式和词性识别方式;
所述结构化信息方式包括以下至少一种:关系识别方式、句法分析方式、语义分析方式、事件抽取方式和多轮对话方式,所述多轮对话方式是具有上下文的结构化信息方式;
所述序列生成方式包括以下至少一种:机器翻译方式、文本摘要方式和文本生成方式。
7.根据权利要求6所述的基于弱监督技术主动学习的智能标注装置,其特征在于,所述数据标注模块具体用于:
若根据所述标注方式无法对所述待标注数据进行数据标注,则生成待标注提示信息,接收输入设备输入的标注信息,并根据所述标注信息得到标注数据。
8.一种基于弱监督技术主动学习的智能标注平台,其特征在于,包括如权利要求6或7所述的基于弱监督技术主动学习的智能标注装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗彤;北京融汇金信信息技术有限公司,未经罗彤;北京融汇金信信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911127625.3/1.html,转载请声明来源钻瓜专利网。