[发明专利]一种基于多数据集多标签联合训练的命名实体识别方法在审
申请号: | 202110035702.3 | 申请日: | 2021-01-12 |
公开(公告)号: | CN112364656A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 王全修;靳雯;杨培文;王明超;路琦 | 申请(专利权)人: | 北京睿企信息科技有限公司;日照睿安信息科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06F16/35;G06K9/62 |
代理公司: | 北京纽乐康知识产权代理事务所(普通合伙) 11210 | 代理人: | 田磊 |
地址: | 100013 北京市东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多数据集多标签联合训练的命名实体识别方法,包括准备训练数据;搭建一个具有多个独立的分类器的模型;将训练数据平行输入到多个独立的分类器中,每个分类器负责一个实体类型的序列标注;训练模型,数据集当中标注了实体类型的分类器参与训练;用所述模型预测新的数据。本发明方法从效率和占用的资源来看,相比于之前的方法,只需要调用资源消耗较大的BERT模型,而其他的方法都需要调取n次模型,甚至是调取m次,因此此方法在节约资源方面具有显著优势,并且解决了命名实体识别中的实体重叠问题和不同数据集包含不同标签的问题,在推断时可以节省大量计算资源。 | ||
搜索关键词: | 一种 基于 多数 据集多 标签 联合 训练 命名 实体 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京睿企信息科技有限公司;日照睿安信息科技有限公司,未经北京睿企信息科技有限公司;日照睿安信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110035702.3/,转载请声明来源钻瓜专利网。