[发明专利]基于小样本学习的用户圈层挖掘方法、装置、介质及设备在审
| 申请号: | 202211264246.0 | 申请日: | 2022-10-17 |
| 公开(公告)号: | CN115329723A | 公开(公告)日: | 2022-11-11 |
| 发明(设计)人: | 牟昊;袁浩斌;何宇轩;徐亚波;李旭日 | 申请(专利权)人: | 广州数说故事信息科技有限公司 |
| 主分类号: | G06F40/117 | 分类号: | G06F40/117;G06N20/00;G06Q30/02;G06F16/951 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 麦小婵 |
| 地址: | 510620 广东省广州*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 样本 学习 用户 挖掘 方法 装置 介质 设备 | ||
本发明公开了一种基于小样本学习的用户圈层挖掘方法、装置、介质及设备,所述方法包括:从网络平台中获取待处理语料集;对待处理语料集中的所有待处理语料进行圈层标注,获得标注语料集,标注语料集中的每一条标注语料对应标注了至少一个圈层名称,每一个圈层名称对应的标注语料的条数不小于预设条数阈值;对标注语料集进行数据增强处理,根据增强后的标注语料集对预设的小样本学习模型进行训练,获得训练后的小样本学习模型;根据训练后的小样本学习模型对用户账号下的待挖掘语料集进行分类,获得用户所属的圈层名称。采用本发明的技术方案无需耗费大量人力成本和时间成本,能够在短时间、低标注量的情况下实现快速挖掘用户圈层。
技术领域
本发明涉及互联网大数据处理技术领域,尤其涉及一种基于小样本学习的用户圈层挖掘方法、装置、计算机可读存储介质及终端设备。
背景技术
随着互联网和大数据技术的快速发展,如今的社交网络呈现出显著的移动化、本地化特征,社交网络的圈层作为一种用户的频繁活动范围,有利于分析用户在其所属圈层中的相关信息,因此,对用户所属圈层进行挖掘具有十分重要的意义,成为了企业营销数字化环节不可或缺的部分。
传统的用户圈层挖掘方案,大多使用的是规则类(例如正则表达式)的方式对人群进行打标,或者,人工大批量标注数据后使用机器学习训练判别模型,最终确定用户圈层。
但是,随着企业营销数字化转型以及大数据生态与应用的进展,用户圈层也在不断革新,基于传统方案进行圈层构建时,需要耗费大量人力成本调整规则以适应用户圈层的快速变化,或者,需要耗费大量人力标注成本和模型训练时间,均会导致企业无法快速挖掘用户的新圈层而错失商机,因此,开发一种能够支持快速挖掘用户圈层的方案变得十分关键。
发明内容
本发明实施例的目的在于,提供一种基于小样本学习的用户圈层挖掘方法、装置、计算机可读存储介质及终端设备,无需耗费大量人力成本和时间成本,能够在短时间、低标注量的情况下实现快速挖掘用户圈层。
为了实现上述目的,本发明实施例提供了一种基于小样本学习的用户圈层挖掘方法,包括:
从网络平台中获取待处理语料集;
对所述待处理语料集中的所有待处理语料进行圈层标注,获得标注语料集;其中,所述标注语料集中的每一条标注语料对应标注了至少一个圈层名称,每一个圈层名称对应的标注语料的条数不小于预设条数阈值;
对所述标注语料集进行数据增强处理,获得增强后的标注语料集;
根据所述增强后的标注语料集对预设的小样本学习模型进行训练,获得训练后的小样本学习模型;
根据所述训练后的小样本学习模型对用户账号下的待挖掘语料集进行分类,获得用户所属的圈层名称。
进一步地,所述从网络平台中获取待处理语料集,具体包括:
通过关键词搜索从网络平台中获取第一语料集;
通过账号搜索从网络平台中获取第二语料集;
根据所述第一语料集和所述第二语料集获得所述待处理语料集。
进一步地,所述对所述待处理语料集中的所有待处理语料进行圈层标注,获得标注语料集,具体包括:
对所述第一语料集中的所有待处理语料进行逐条标注,确定每一条待处理语料对应的圈层名称;
对所述第二语料集中的所有待处理语料进行逐条标注或一键标注,确定每一条待处理语料对应的圈层名称;
根据标注后的第一语料集和标注后的第二语料集获得所述标注语料集。
进一步地,所述根据标注后的第一语料集和标注后的第二语料集获得所述标注语料集,具体包括:
S21、对所述标注后的第一语料集和所述标注后的第二语料集中的标注语料进行合并去重处理;
S22、判断去重后的标注语料的条数是否满足以下条件:每一个圈层名称对应的标注语料的条数不小于预设条数阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州数说故事信息科技有限公司,未经广州数说故事信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211264246.0/2.html,转载请声明来源钻瓜专利网。





