[发明专利]表征模型的训练方法、装置、可读存储介质及计算设备在审
申请号: | 202210582911.4 | 申请日: | 2022-05-26 |
公开(公告)号: | CN114970716A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 曲波 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00;G06Q10/04;G06Q40/08 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表征 模型 训练 方法 装置 可读 存储 介质 计算 设备 | ||
本说明书实施例提供了表征模型的训练方法、装置、可读存储介质及计算设备。该方法包括:获取多个业务样本,任意业务样本包括业务事件的事件特征,并具有若干个业务分类任务各自对应的标签值;利用表征模型得到分别与多个业务样本一一对应的多个表征向量;对于多个业务样本中的目标业务样本,确定与该样本具有相同标签值的若干个第一样本、不同标签值的若干个第二样本;基于多个表征向量,计算各第一样本、各第二样本分别与该样本的相似度,得到对比学习结果;基于目标业务样本的对比学习结果,训练表征模型,使得表征模型学习相似的业务事件之间的关系、不同业务事件之间的区别,提高表征向量的召回能力。
技术领域
本说明书一个或多个实施例涉及机器学习领域,尤其涉及表征模型的训练方法、装置、可读存储介质及计算设备。
背景技术
业务事件是指与业务有关的事件,例如交易事件、买卖事件、资金事件、支付事件。为了便于对业务事件进行分析,通常需要表征模型对业务事件进行表征,得到的表征向量可以用于实现后续业务。这些后续业务可能是相似的业务事件的检索,也可能是相似的业务事件分析,因此,需要表征向量具有召回能力。目前亟需一种表征模型的训练方案以提高表征向量的召回能力。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容
本说明书一个或多个实施例描述了一种表征模型的训练方法、装置、计算机可读存储介质及计算设备,通过有监督的对比学习的方式训练表征模型,使得表征模型学习相似的业务事件之间的关系、不同业务事件之间的区别;后续,在通过表征模型对业务事件进行表征时,得到的表征向量具有较好的召回能力。
根据第一方面,提供了一种表征模型的训练方法,包括:
获取多个业务样本,任意业务样本包括业务事件的事件特征,并具有若干个业务分类任务各自对应的标签值;
利用表征模型,对所述多个业务样本分别进行事件特征编码处理,得到分别与所述多个业务样本一一对应的多个表征向量;
对于所述多个业务样本中的目标业务样本,从所述多个业务样本中,确定与所述目标业务样本在所述若干个业务分类任务中的目标任务下,具有相同标签值的若干个第一样本、以及不同标签值的若干个第二样本;基于所述多个表征向量,计算各第一样本、各第二样本分别与所述目标业务样本的相似度,得到所述目标业务样本的对比学习结果;
至少基于所述目标业务样本的对比学习结果,训练所述表征模型。
根据一种可行的实现方式,所述方法还包括:对于若干个业务分类任务中的任意任务,将所述多个表征向量分别输入到该任务对应的任务模型进行任务预测,得到预测结果,其中包括所述多个业务样本各自针对该任务的预测值;则所述至少基于所述目标业务样本的对比学习结果,训练所述表征模型,包括:至少基于若干个业务分类任务各自对应的预测结果、所述多个业务样本各自具有的各标签值、所述目标业务样本的对比学习结果,训练所述表征模型。
在一个例子中,所述方法还包括:对于若干个业务分类任务中的任意任务,基于对应的预测结果中所述多个业务样本各自的预测值和所述多个业务样本各自具有的该任务的标签值,训练该任务对应的任务模型。
在一个例子中,所述任务模型包括编码层和预测层,所述任务预测包括:对于所述多个表征向量中的任一向量,通过所述编码层对所述表征向量进行处理实现信息融合,输出融合向量;通过所述预测层基于所述融合向量进行针对该任务的预测,得到所述任一向量对应的业务样本的预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210582911.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多孔碳材料及其制备方法和应用
- 下一篇:检测寄存器的方法、电路和雷达