[发明专利]一种基于ALBERT的科协活动命名实体识别的方法在审
申请号: | 202210163205.6 | 申请日: | 2022-02-22 |
公开(公告)号: | CN114548106A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 陈万志;李思凡 | 申请(专利权)人: | 辽宁工程技术大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京华夏正合知识产权代理事务所(普通合伙) 11017 | 代理人: | 韩登营;张丽萍 |
地址: | 123000 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 albert 科协 活动 命名 实体 识别 方法 | ||
1.一种基于ALBERT的科协活动命名实体识别的方法,其特征在于,包括以下步骤:
S1、将输入的科协活动文本转化为词向量;
S2、将输入的词向量进行编码,提取全文特征信息;
S3、学习标签之间的约束,输出概率最高的标签序列。
2.如权利要求1所述的基于ALBERT的科协活动命名实体识别的方法,其特征在于,步骤S1采用轻量级的ALBERT模型;步骤S2采用BiLSTM的变体BiGRU结合多头自注意力机制;步骤S3采用CRF获取全局最优序列。
3.如权利要求2所述的基于ALBERT的科协活动命名实体识别的方法,其特征在于,所述ALBERT模型通过参数因式分解技术,引进一个低维向量,将全连接层与Attention层的参数都进行共享,提升训练速度。
4.如权利要求2所述的基于ALBERT的科协活动命名实体识别的方法,其特征在于,所述多头自注意力机制为自注意力机制的集合,每个注意力头学习在不同表示空间中的特征,结合序列各个位置的相关度,扩展了模型对不同位置的关注能力。
5.如权利要求2所述的基于ALBERT的科协活动命名实体识别的方法,其特征在于,所述CRF在训练过程中学习相邻标签间的约束关系,提高预测输入句子标签序列的准确性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁工程技术大学,未经辽宁工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210163205.6/1.html,转载请声明来源钻瓜专利网。