[发明专利]一种多模态信息选择性融合的中文命名实体识别方法在审
| 申请号: | 202210810750.X | 申请日: | 2022-07-11 |
| 公开(公告)号: | CN115374784A | 公开(公告)日: | 2022-11-22 |
| 发明(设计)人: | 蔡佳豪;张华平;商建云 | 申请(专利权)人: | 北京理工大学 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 王松 |
| 地址: | 100081 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 多模态 信息 选择性 融合 中文 命名 实体 识别 方法 | ||
1.一种多模态信息选择性融合的中文命名实体识别方法,其特征在于,首先,将原文本使用词典匹配方法获取单词的语义信息,并使用由头尾位置转换而来的相对位置编码来适应单词边界信息;
然后,对于文本的每一个字符,使用CNN网络来提取汉字的拼音和偏旁部首信息;当得到汉字的字音Pinyin、字形Radical和语义Lattice信息后,使用Cross Transformer来增强Lattice与Pinyin、Lattice与Radical的语义信息;
之后,采用选择性融合方式集成这些向量,包括字符粒度、句子粒度两个层面的融合信息;
最后,对单词部分进行屏蔽,将融合后的信息传递给条件随机场,得到最终的标签预测概率,从而完成中文命名实体识别。
2.如权利要求1所述的一种多模态信息选择性融合的中文命名实体识别方法,其特征在于:
获取语义Lattice信息的方法为:首先,使用词典匹配方法获取汉字的语义信息,并使用由头尾位置转换而来的相对位置编码来适应单词边界信息;然后,使用预先训练好的词向量初始化获取Lattice Embedding;
获取字音Pinyin信息,包括汉字的声母韵母和音调,将每个汉字的拼音按照声母、韵母、音调顺序组合,然后按照式1输入到CNN卷积网络中进行Embedding表示:
xi=f(w·ei:i+h-1+b) (1)
其中,w、b为卷积层参数,h为卷积核宽度,xi为文本中第i个字符拼音经过卷积层后的表示,e表示字符的初始化表示,f为激活函数;
获取字形信息,将汉字结构主体作为汉字的偏旁部首,首先爬取汉字的结构主体,将汉字的结构主体进行顺序组合,然后利用CNN编码为Radical Embedding表示。
3.如权利要求1所述的一种多模态信息选择性融合的中文命名实体识别方法,其特征在于,使用Cross Transformer来增强Lattice与Pinyin、Lattice与Radical的语义信息的方法如下:
基于Cross-Transformer的交互嵌入,包括Embedding向量初始化和Embedding交互嵌入;
步骤a:Embedding向量初始化;
根据汉字的Lattice、Pinyin和Radical Embedding,通过一个线性Transformer模块,得到Cross-Transformer的输入:
其中,EP、ER是汉字Lattice、Pinyin和Radical Embedding;I为单位矩阵,每一个线性映射矩阵W均为可学习参数;L1、L2分别表示与Pinyin和Radical做交互计算的Lattice1和Lattice2;P表示Pinyin,R表示Radical;T表示矩阵的转置;Q、K、V分别表示Cross-Transformer的三个输入Embedding;
步骤b:Embedding交互嵌入,得到Cross-Transformer的输入;之后,使用Cross-Transformer网络进行Lattice与Pinyin、Lattice与Radical的交互嵌入计算:
AttP(QL1,KP,VP)=Softmax(QL1,KP)VP (3)
AttL1(QP,KL1,VL1)=Softmax(QP,KL1)VL1 (4)
AttL2(QR,KL2,VL2)=Softmax(QR,KL2)VL2 (5)
AttR(QL2,KR,VR)=Softmax(QL2,KR)VR (6)
其中,Att为最后得到的Attention Embedding;L1、L2分别表示与Pinyin和Radical做交互计算的Lattice1和Lattice2,P表示Pinyin,R表示Radical;Q、K、V分别表示Cross-Transformer的三个输入Embedding。
4.如权利要求1所述的一种多模态信息选择性融合的中文命名实体识别方法,其特征在于,选择性融合的方法如下:
步骤I:字符粒度权重选择;
使用hi来表示第i个字符的Attention向量;使用一个选择性的门单元来控制有多少信息能够流向混合的Embedding表示,门值由一个全连接层和一个sigmoid函数计算出来;输入包括经过Cross-Transformer之后的Cross Attention表示;将Pinyin、两个Lattice和Radical模式的门值表示为gp、gl1、gl2、gr,则第i个字符的融合Embedding表示如下计算:
其中,Wp,Wl1,Wl2,Wr,bp,bl1,bl2,br均为可学习的参数;σ是sigmoid函数;分别表示第i个字符在Pinyin、Lattice1、Lattice2和Radical的Attention向量;
步骤II:融合Embedding表示;
在步骤I中得到各个embedding的门值之后,将各个Attention Embedding与门值进行加权求和,得到融合Embedding表示
步骤III:句子粒度学习;
应用Transformer Layer,在句子级别来充分学习Lattice、Pinyin和Radical信息;所有字符的混合表征被打包成:
其中,H0表示所有字符的混合表征,表示第N个字符的融合表征,表示第M个字符的融合表征;
则最终的混合Embedding表示,按照如下方式进行计算:
H=Transformer(H0) (13)
其中,H表示经过Transformer层的隐藏层输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210810750.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种针对智能反射面的测试系统及测试方法
- 下一篇:水泥胶砂及其制备方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





