[发明专利]观点分类模型生成方法、观点分类方法、电子设备和介质在审
申请号: | 202310476611.2 | 申请日: | 2023-04-27 |
公开(公告)号: | CN116522203A | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 张晓辉;刘志远;谢奇奇;刘超;刘朋樟;包勇军 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F18/24 | 分类号: | G06F18/24;G06F18/214;G06N3/092;G06F16/35 |
代理公司: | 北京唯智勤实知识产权代理事务所(普通合伙) 11557 | 代理人: | 姜悦 |
地址: | 101116 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 观点 分类 模型 生成 方法 电子设备 介质 | ||
1.一种观点分类模型生成方法,包括:
根据未标注观点数据集,执行以下训练步骤:
根据未标注观点数据集和初始训练数据集,确定训练数据集和剩余未标注观点数据集,其中,所述训练数据集中的训练数据为标注观点数据;
根据训练数据集对应的训练集和目标观点分类模型,训练得到第一观点分类模型;
根据第一观点分类模型、剩余未标注观点数据集和训练数据集对应的测试集,生成第一测试文本向量集和第一未标注文本向量集;
根据第一测试文本向量集、第一未标注文本向量集、剩余未标注观点数据集和强化网络模型,对训练数据集进行扩充处理;
根据扩充处理后的训练数据集对应的训练集,训练得到第二观点分类模型;
响应于确定第二观点分类模型的分类准确率满足预设准确率条件,将第二观点分类模型确定为训练完成的观点分类模型。
2.根据权利要求1所述的方法,其中,在所述对训练数据集进行扩充处理之后,所述方法还包括:
对剩余未标注观点数据集进行删减处理。
3.根据权利要求2所述的方法,其中,在所述根据扩充处理后的训练数据集对应的训练集,训练得到第二观点分类模型之后,所述方法还包括:
根据第二观点分类模型、删减处理后的剩余未标注观点数据集和扩充处理后的训练数据集对应的测试集,生成第二测试文本向量集和第二未标注文本向量集;
将第一测试文本向量集、第一未标注文本向量集、扩充位置信息、第二测试文本向量集、第二未标注文本向量集和准确率提升信息作为样本添加至经验池。
4.根据权利要求3所述的方法,其中,在所述将第一测试文本向量集、第一未标注文本向量集、扩充位置信息、第二测试文本向量集、第二未标注文本向量集和准确率提升信息作为样本添加至经验池之后,所述方法还包括:
根据经验池,执行以下强化训练步骤:
从经验池中选择样本集;
根据所述样本集和对应强化网络模型的目标强化网络模型,对强化网络模型进行训练;
响应于确定当前执行次数满足预设次数间隔条件,根据所确定的强化网络模型的网络参数,对目标强化网络模型的网络参数进行更新;
响应于确定当前执行次数满足预设次数条件,将所训练的强化网络模型确定为训练完成的强化网络模型。
5.根据权利要求4所述的方法,其中,所述强化训练步骤还包括:
响应于确定当前执行次数不满足所述预设次数条件,将所训练的强化网络模型作为强化网络模型,再次执行所述强化训练步骤。
6.根据权利要求5所述的方法,其中,所述训练步骤还包括:
响应于确定第二观点分类模型的分类准确率不满足所述预设准确率条件,将删减处理后的剩余未标注观点数据集作为未标注观点数据集,将扩充处理后的训练数据集作为初始训练数据集,将训练完成的强化网络模型作为强化网络模型,将第二观点分类模型确定为目标观点分类模型,再次执行所述训练步骤。
7.根据权利要求1所述的方法,其中,所述根据未标注观点数据集和初始训练数据集,确定训练数据集和剩余未标注观点数据集,包括:
从所述未标注观点数据集中选择预设数量个未标注观点数据作为待标注观点数据集;
将所述待标注观点数据集发送至标注终端;
根据接收的所述标注终端发送的对应所述待标注观点数据集的各个标注观点数据,确定标注观点数据集;
将所述标注观点数据集和所述初始训练数据集的并集确定为训练数据集;
从所述未标注观点数据集中删除所述待标注观点数据集,得到剩余未标注观点数据集。
8.根据权利要求7所述的方法,其中,所述根据接收的所述标注终端发送的对应所述待标注观点数据集的各个标注观点数据,确定标注观点数据集,包括:
响应于确定所述各个标注观点数据的数量与所述待标注观点数据集包括的各个待标注观点数据的数量相同,将所述各个标注观点数据确定为标注观点数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310476611.2/1.html,转载请声明来源钻瓜专利网。