[发明专利]数据处理模型的生成方法、数据处理方法及装置在审
申请号: | 202210337329.1 | 申请日: | 2022-03-31 |
公开(公告)号: | CN114723576A | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 荣钰;刘阳 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 贾允 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 模型 生成 方法 装置 | ||
本申请公开了数据处理模型的生成方法、数据处理方法及装置,所述方法采用了人工智能中的对比学习算法,该方法将对象关联信息和样本传播链输入到待训练模型中进行传播特征构建,得到与样本传播链对应的样本传播链特征,对象关联信息可以为图结构,基于样本传输链对应的正样本、样本传输链对应的负样本以及样本传播链特征,确定传播损失信息并进行模型训练,可以得到传播数据处理模型。该方法可以通过对比学习算法,并结合了图结构和传播过程的特征信息生成传播数据处理模型,从而提高了传播数据处理的效率和传播节点预测的准确性。
技术领域
本申请涉及计算机数据处理技术领域,尤其涉及数据处理模型的生成方法、数据处理方法及装置。
背景技术
社交平台作为人们获取信息,分享信息的重要渠道之一,虽然一方面推动了电子商务等信息产业的发展,但同时也对增大了不良信息传播造成的危害。而针对信息传播路径的预测可以缓解这方面的问题。现有技术中,一般采用深度学习模型进行信息传播路径预测,但由于训练数据的不平衡,会影响部分用户的预测效果,从而导致传播节点预测的准确性低的问题。
发明内容
本申请提供了数据处理模型的生成方法、数据处理方法及装置,可以提高传播节点预测的准确性。
一方面,本申请提供了一种数据处理模型的生成方法,所述方法包括:
获取对象关联信息,所述对象关联信息为以多个对象为节点,以两两对象间的关联关系为边构建得到的;
将所述对象关联信息和样本传播链输入到待训练模型中进行传播特征构建,得到与所述样本传播链对应的样本传播链特征;所述样本传播链包括已传播对象;
基于所述样本传输链对应的正样本、所述样本传输链对应的负样本以及所述样本传播链特征,确定传播损失信息;所述正样本为所述样本传播链对应的目标传播对象,所述负样本为所述多个对象中除所述目标传播对象之外的对象;
基于所述传播损失信息,对所述待训练模型进行训练,得到传播数据处理模型。
另一方面提供了一种数据处理方法,所述方法包括:
获取目标传播链,所述目标传播链包括已传播对象;
将对象关联信息和目标传播链输入到目标传播数据处理模型中进行传播对象预测,得到所述目标传播链对应的目标传播对象,所述对象关联信息为以多个对象为节点,以两两对象间的关联关系为边构建得到的,所述目标传播数据处理模型为基于上述所述的数据处理模型的生成方法得到的。
另一方面提供了一种数据处理模型的生成装置,所述装置包括:
对象关联信息获取模块,用于获取对象关联信息,所述对象关联信息为以多个对象为节点,以两两对象间的关联关系为边构建得到的;
传播特征构建模块,用于将所述对象关联信息和样本传播链输入到待训练模型中进行传播特征构建,得到与所述样本传播链对应的样本传播链特征;所述样本传播链包括已传播对象;
传播损失确定模块,用于基于所述样本传输链对应的正样本、所述样本传输链对应的负样本以及所述样本传播链特征,确定传播损失信息;所述正样本为所述样本传播链对应的目标传播对象,所述负样本为所述多个对象中除所述目标传播对象之外的对象;
模型训练模型,用于基于所述传播损失信息,对所述待训练模型进行训练,得到传播数据处理模型。
另一方面提供了一种数据处理装置,所述装置包括:
目标传播链获取模块,用于获取目标传播链,所述目标传播链包括已传播对象;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210337329.1/2.html,转载请声明来源钻瓜专利网。