[发明专利]负样本构造方法、装置、计算设备及存储介质在审
申请号: | 202310423240.1 | 申请日: | 2023-04-19 |
公开(公告)号: | CN116432035A | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 张凯;仝春艳;崔向阳;轩占伟;黄涛;杨松 | 申请(专利权)人: | 人民网股份有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F16/9536;G06Q50/00 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 宋菲 |
地址: | 100026 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 构造 方法 装置 计算 设备 存储 介质 | ||
1.一种负样本构造方法,其特征在于,所述方法包括:
根据目标用户的社交数据确定一批潜在曝光用户;
获取该批潜在曝光用户的社交状态;
若所述目标用户的已发布内容被曝光给任一潜在曝光用户且该潜在曝光用户的社交状态为活跃状态,将该潜在曝光用户标记为可信曝光用户;
根据各个可信曝光用户的指定交互行为数据,构造第一数据集;以及,根据所述已发布内容的各个真实交互用户的指定交互行为数据,构造第二数据集;
对所述第一数据集和第二数据集求取差集数据,得到各个负样本数据。
2.根据权利要求1所述的方法,其特征在于,所述得到各个负样本数据之后,所述方法进一步包括:
根据所述各个负样本数据与正样本数据构建训练集,利用所述训练集对预设分类模型进行训练,得到目标分类模型;
通过所述目标分类模型对各个负样本数据进行分类,得到各个负样本数据的分值,剔除分值不满足预设条件的负样本数据。
3.根据权利要求1所述的方法,其特征在于,所述获取该批潜在曝光用户的社交状态进一步包括:
根据任一潜在曝光用户的预设社交行为的时间信息和/或频次信息,获取该潜在曝光用户的社交状态。
4.根据权利要求3所述的方法,其特征在于,所述预设社交行为包括以下行为中的一项或多项:平台登录行为、内容发布行为、针对曝光内容的指定交互行为。
5.根据权利要求4所述的方法,其特征在于,所述指定交互行为包括以下行为中的一项或多项:转发行为、评论行为、点赞行为。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述社交数据包括社交关系数据,所述根据目标用户的社交数据确定一批潜在曝光用户进一步包括:
根据目标用户的社交关系数据,确定与所述目标用户具有社交关系的潜在曝光用户。
7.根据权利要求1-5中任一项所述的方法,其特征在于,所述社交数据还包括:已发布内容的热度信息,所述根据目标用户的社交数据确定一批潜在曝光用户进一步包括:
若所述目标用户的已发布内容的热度信息满足预设曝光条件,根据曝光规则确定至少一个潜在曝光用户。
8.一种负样本构造装置,其特征在于,所述装置包括:
分析模块,适于根据目标用户的社交数据确定一批潜在曝光用户;获取该批潜在曝光用户的社交状态;
决策模块,适于若所述目标用户的已发布内容被曝光给任一潜在曝光用户且该潜在曝光用户的社交状态为活跃状态,将该潜在曝光用户标记为可信曝光用户;
数据构造模块,适于根据各个可信曝光用户的指定交互行为数据,构造第一数据集;以及,根据所述已发布内容的各个真实交互用户的指定交互行为数据,构造第二数据集;
处理模块,适于对所述第一数据集和第二数据集求取差集数据,得到各个负样本数据。
9.一种计算设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的负样本构造方法对应的操作。
10.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的负样本构造方法对应的操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人民网股份有限公司,未经人民网股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310423240.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种模型方案托管服务系统
- 下一篇:一种粉体物料的加料设备