[发明专利]一种基于文本-图片关系预训练的多模态推文命名实体识别的方法在审
申请号: | 202011116968.2 | 申请日: | 2020-10-19 |
公开(公告)号: | CN112257445A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 翁芳胜;孙霖;王跻权;孙宇轩 | 申请(专利权)人: | 浙大城市学院 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/284;G06N3/04;G06N3/08 |
代理公司: | 杭州九洲专利事务所有限公司 33101 | 代理人: | 张羽振 |
地址: | 310015 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于文本‑图片关系预训练的多模态推文命名实体识别的方法,包括:步骤1、大规模数据收集;步骤2、建立关系推断和视觉注意的预训练多模态网络模型(RIVA模型);步骤3、预训练任务。本发明的有益效果是:本发明利用关系推断和视觉注意,通过减轻在多模态模型在融合不匹配的视觉与文本信息时产生的负面影响,以帮助多模态信息更好的融合。本发明使用教师‑学生半监督学习方法,在可批量获取的大型未标记的推文数据上进行了图文关系预训练,生成一个带有标签的数据集,然后在人工标注的小型数据集上做微调,扩充数据的同时提高了文本图像分类网络的性能。 | ||
搜索关键词: | 一种 基于 文本 图片 关系 训练 多模态推文 命名 实体 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙大城市学院,未经浙大城市学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011116968.2/,转载请声明来源钻瓜专利网。