[发明专利]基于多语言预训练模型的事件触发词检测与分类方法在审
申请号: | 202210404007.4 | 申请日: | 2022-04-18 |
公开(公告)号: | CN114896394A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 黄永忠;张晨昊;秦韬 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/30;G06F40/49;G06K9/62;G06F16/33 |
代理公司: | 桂林文必达专利代理事务所(特殊普通合伙) 45134 | 代理人: | 白洪 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及自然语言处理技术领域,具体涉及一种基于多语言预训练模型的事件触发词检测与分类方法,首先构建事件触发词与事件要素的向量池,再使用现有的工具对事件进行语义角色标注,最后再以相似度计算方法将它们映射到给定的事件类型进行分类。本发明有效地减弱了人工进行事件标注的工作量,并且方便拓展到其他事件类型;使用多语言的预训练模型进行编码,让多种语言可以在一个向量池上进行相似性挖掘与预测,减少了一种语言训练一个模型的工作量;使用多语言的预训练模型,准备阶段中使用中英等外部新闻语料库丰富的数据量,避免了稀缺语言资源使用该方法却没有丰富新闻语料库扩充向量池的问题。 | ||
搜索关键词: | 基于 语言 训练 模型 事件 触发 检测 分类 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210404007.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种二氧化碳的利用方法
- 下一篇:一种市政道路给排水管道防渗漏检测装置