[发明专利]观点分类模型生成方法、观点分类方法、电子设备和介质在审
申请号: | 202310476611.2 | 申请日: | 2023-04-27 |
公开(公告)号: | CN116522203A | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 张晓辉;刘志远;谢奇奇;刘超;刘朋樟;包勇军 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F18/24 | 分类号: | G06F18/24;G06F18/214;G06N3/092;G06F16/35 |
代理公司: | 北京唯智勤实知识产权代理事务所(普通合伙) 11557 | 代理人: | 姜悦 |
地址: | 101116 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 观点 分类 模型 生成 方法 电子设备 介质 | ||
本公开的实施例公开了观点分类模型生成方法、观点分类方法、电子设备和介质。该方法的一具体实施方式包括:确定训练数据集和剩余未标注观点数据集;根据训练集训练第一观点分类模型;根据第一观点分类模型、剩余未标注观点数据集和测试集,生成第一测试文本向量集和第一未标注文本向量集;根据第一测试文本向量集、第一未标注文本向量集、剩余未标注观点数据集和强化网络模型,对训练数据集进行扩充;根据扩充后的训练数据集的训练集,训练第二观点分类模型;响应于第二观点分类模型的分类准确率满足预设准确率条件,将第二观点分类模型确定为观点分类模型。该实施方式与数据标注有关,减少了训练观点分类模型时标注数据的耗时,提高了标注效率。
技术领域
本公开的实施例涉及计算机技术领域,具体涉及观点分类模型生成方法、观点分类方法、电子设备和介质。
背景技术
随着线上物品流转数量的激增,针对线上物品的评价数据也越来越多。根据评价数据识别针对物品的观点时,通常采用深度学习模型。深度学习模型的重要前提既是数据标注。目前,在对评价数据进行数据标注时,通常采用的方式为:人工标注大量数据,或通过使用置信度、信息熵结合聚类算法挖掘评价数据进行人工标注。
然而,发明人发现,当采用上述方式对评价数据进行数据标注时,经常会存在如下技术问题:人工标注大量数据耗时较长、效率较低,通过使用置信度、信息熵结合聚类算法挖掘评价数据进行人工标注的方式,导致被人工标注的评价数据对模型准确度贡献的不确定性较高,从而导致人工标注的对模型准确度贡献度较小的评价数据的数量较多,造成标注耗时较长、效率较低。
该背景技术部分中所公开的以上信息仅用于增强对本发明构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开的一些实施例提出了观点分类模型生成方法、观点分类方法、装置、电子设备、计算机可读介质和计算机程序产品,来解决以上背景技术部分提到的技术问题中的一项或多项。
第一方面,本公开的一些实施例提供了一种观点分类模型生成方法,该方法包括:根据未标注观点数据集,执行以下训练步骤:根据未标注观点数据集和初始训练数据集,确定训练数据集和剩余未标注观点数据集,其中,上述训练数据集中的训练数据为标注观点数据;根据训练数据集对应的训练集和目标观点分类模型,训练得到第一观点分类模型;根据第一观点分类模型、剩余未标注观点数据集和训练数据集对应的测试集,生成第一测试文本向量集和第一未标注文本向量集;根据第一测试文本向量集、第一未标注文本向量集、剩余未标注观点数据集和强化网络模型,对训练数据集进行扩充处理;根据扩充处理后的训练数据集对应的训练集,训练得到第二观点分类模型;响应于确定第二观点分类模型的分类准确率满足预设准确率条件,将第二观点分类模型确定为训练完成的观点分类模型。
可选地,在上述对训练数据集进行扩充处理之后,上述方法还包括:对剩余未标注观点数据集进行删减处理。
可选地,在上述根据扩充处理后的训练数据集对应的训练集,训练得到第二观点分类模型之后,上述方法还包括:根据第二观点分类模型、删减处理后的剩余未标注观点数据集和扩充处理后的训练数据集对应的测试集,生成第二测试文本向量集和第二未标注文本向量集;将第一测试文本向量集、第一未标注文本向量集、扩充位置信息、第二测试文本向量集、第二未标注文本向量集和准确率提升信息作为样本添加至经验池。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310476611.2/2.html,转载请声明来源钻瓜专利网。