[发明专利]多模态负样本构建、模型预训练方法、装置、设备及介质在审
申请号: | 202310076945.0 | 申请日: | 2023-01-16 |
公开(公告)号: | CN116127319A | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 黄彬;贺峰;汪琦;冯知凡;崔骁鹏;佘俏俏 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/23;G06F16/36;G06F16/35 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孔凡红 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开提供了一种多模态负样本的构建、多模态模型的预训练方法、装置、设备及介质,涉及数据处理技术领域,具体涉及人工智能及知识图谱技术。该多模态负样本的构建方法包括:获取多个多模态正样本,并在各多模态正样本中进行实体识别,获取与各多模态正样本对应的目标实体;根据各目标实体在知识图谱中的实体位置,将各多模态正样本聚类为至少一个样本簇;使用同一样本簇中的各多模态正样本,构建得到多模态负样本。本公开技术方案提供了一种挖掘多模态困难负样本的新方式,可以在无需任何先验知识的前提下,简单、便捷的挖掘出高质量的多模态困难负样本。 | ||
搜索关键词: | 多模态负 样本 构建 模型 训练 方法 装置 设备 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310076945.0/,转载请声明来源钻瓜专利网。