[发明专利]一种多模态信息选择性融合的中文命名实体识别方法在审

专利信息
申请号: 202210810750.X 申请日: 2022-07-11
公开(公告)号: CN115374784A 公开(公告)日: 2022-11-22
发明(设计)人: 蔡佳豪;张华平;商建云 申请(专利权)人: 北京理工大学
主分类号: G06F40/295 分类号: G06F40/295;G06F40/30;G06N3/04;G06N3/08
代理公司: 北京正阳理工知识产权代理事务所(普通合伙) 11639 代理人: 王松
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 多模态 信息 选择性 融合 中文 命名 实体 识别 方法
【权利要求书】:

1.一种多模态信息选择性融合的中文命名实体识别方法,其特征在于,首先,将原文本使用词典匹配方法获取单词的语义信息,并使用由头尾位置转换而来的相对位置编码来适应单词边界信息;

然后,对于文本的每一个字符,使用CNN网络来提取汉字的拼音和偏旁部首信息;当得到汉字的字音Pinyin、字形Radical和语义Lattice信息后,使用Cross Transformer来增强Lattice与Pinyin、Lattice与Radical的语义信息;

之后,采用选择性融合方式集成这些向量,包括字符粒度、句子粒度两个层面的融合信息;

最后,对单词部分进行屏蔽,将融合后的信息传递给条件随机场,得到最终的标签预测概率,从而完成中文命名实体识别。

2.如权利要求1所述的一种多模态信息选择性融合的中文命名实体识别方法,其特征在于:

获取语义Lattice信息的方法为:首先,使用词典匹配方法获取汉字的语义信息,并使用由头尾位置转换而来的相对位置编码来适应单词边界信息;然后,使用预先训练好的词向量初始化获取Lattice Embedding;

获取字音Pinyin信息,包括汉字的声母韵母和音调,将每个汉字的拼音按照声母、韵母、音调顺序组合,然后按照式1输入到CNN卷积网络中进行Embedding表示:

xi=f(w·ei:i+h-1+b) (1)

其中,w、b为卷积层参数,h为卷积核宽度,xi为文本中第i个字符拼音经过卷积层后的表示,e表示字符的初始化表示,f为激活函数;

获取字形信息,将汉字结构主体作为汉字的偏旁部首,首先爬取汉字的结构主体,将汉字的结构主体进行顺序组合,然后利用CNN编码为Radical Embedding表示。

3.如权利要求1所述的一种多模态信息选择性融合的中文命名实体识别方法,其特征在于,使用Cross Transformer来增强Lattice与Pinyin、Lattice与Radical的语义信息的方法如下:

基于Cross-Transformer的交互嵌入,包括Embedding向量初始化和Embedding交互嵌入;

步骤a:Embedding向量初始化;

根据汉字的Lattice、Pinyin和Radical Embedding,通过一个线性Transformer模块,得到Cross-Transformer的输入:

其中,EP、ER是汉字Lattice、Pinyin和Radical Embedding;I为单位矩阵,每一个线性映射矩阵W均为可学习参数;L1、L2分别表示与Pinyin和Radical做交互计算的Lattice1和Lattice2;P表示Pinyin,R表示Radical;T表示矩阵的转置;Q、K、V分别表示Cross-Transformer的三个输入Embedding;

步骤b:Embedding交互嵌入,得到Cross-Transformer的输入;之后,使用Cross-Transformer网络进行Lattice与Pinyin、Lattice与Radical的交互嵌入计算:

AttP(QL1,KP,VP)=Softmax(QL1,KP)VP (3)

AttL1(QP,KL1,VL1)=Softmax(QP,KL1)VL1 (4)

AttL2(QR,KL2,VL2)=Softmax(QR,KL2)VL2 (5)

AttR(QL2,KR,VR)=Softmax(QL2,KR)VR (6)

其中,Att为最后得到的Attention Embedding;L1、L2分别表示与Pinyin和Radical做交互计算的Lattice1和Lattice2,P表示Pinyin,R表示Radical;Q、K、V分别表示Cross-Transformer的三个输入Embedding。

4.如权利要求1所述的一种多模态信息选择性融合的中文命名实体识别方法,其特征在于,选择性融合的方法如下:

步骤I:字符粒度权重选择;

使用hi来表示第i个字符的Attention向量;使用一个选择性的门单元来控制有多少信息能够流向混合的Embedding表示,门值由一个全连接层和一个sigmoid函数计算出来;输入包括经过Cross-Transformer之后的Cross Attention表示;将Pinyin、两个Lattice和Radical模式的门值表示为gp、gl1、gl2、gr,则第i个字符的融合Embedding表示如下计算:

其中,Wp,Wl1,Wl2,Wr,bp,bl1,bl2,br均为可学习的参数;σ是sigmoid函数;分别表示第i个字符在Pinyin、Lattice1、Lattice2和Radical的Attention向量;

步骤II:融合Embedding表示;

在步骤I中得到各个embedding的门值之后,将各个Attention Embedding与门值进行加权求和,得到融合Embedding表示

步骤III:句子粒度学习;

应用Transformer Layer,在句子级别来充分学习Lattice、Pinyin和Radical信息;所有字符的混合表征被打包成:

其中,H0表示所有字符的混合表征,表示第N个字符的融合表征,表示第M个字符的融合表征;

则最终的混合Embedding表示,按照如下方式进行计算:

H=Transformer(H0) (13)

其中,H表示经过Transformer层的隐藏层输出。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210810750.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top