[发明专利]一种多模态信息选择性融合的中文命名实体识别方法在审

专利信息
申请号: 202210810750.X 申请日: 2022-07-11
公开(公告)号: CN115374784A 公开(公告)日: 2022-11-22
发明(设计)人: 蔡佳豪;张华平;商建云 申请(专利权)人: 北京理工大学
主分类号: G06F40/295 分类号: G06F40/295;G06F40/30;G06N3/04;G06N3/08
代理公司: 北京正阳理工知识产权代理事务所(普通合伙) 11639 代理人: 王松
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 多模态 信息 选择性 融合 中文 命名 实体 识别 方法
【说明书】:

发明涉及一种多模态信息选择性融合的中文命名实体识别方法,属于自然语言处理技术领域。本发明有效解决了如何将字音和字形这两个重要信息有效融入命名实体识别中,通过在命名实体识别的输入中,加入携带语义信息的字符的拼音与偏旁部首序列,赋予了向量更强的语义信息。采用选择性融合,能够动态地控制字音和字形特征所占的权重,有效提升了命名实体识别性能。本发明能够为机器翻译、问答系统和阅读理解等自然语言处理任务提供有效支持。

技术领域

本发明涉及一种中文命名实体识别方法,具体涉及一种选择性融合了词汇、字音和字形等多模态信息的中文命名实体识别方法,属于自然语言处理技术领域。

背景技术

命名实体识别(Named Entity Recognition,NER)技术,旨在从给定的文本序列中检测实体提及的边界并判断其所属类别。该技术是机器翻译、问答系统和阅读理解等多项自然语言处理下游任务的基础。NER的研究难点主要在于中文文本的语义分析困难,表现在词汇信息融合困难、汉字语义信息的引入困难等方面。

不同于英文文本,中文的单词之间没有空格作为边界,而单个字所能表示的语义有限。因此,如何将词汇信息融入到模型中,成为多项中文自然语言处理任务的研究热点。

在中文命名实体识别任务上,为了充分利用语义更为丰富的词汇信息,技术人员设计了基于自动分词器、多字符表示和外部词典等多种资源的神经网络模型。其中,以流水线方式作业的分词-实体识别框架受限于中文分词的正确性,在低资源领域表现较差。而多字符表示蕴含了字符间的共现信息,在一定程度上补充了上下文语境信息,但多数多字符组合并不具备实际的词义,无法很好地模拟词汇信息。

为了避免分词器的错误传播问题和多字符表示的语义不足的问题,将外部词典与字粒度NER模型结合,成为了目前主流的词信息融合方式。其中, Lattice-LSTM将输入文本中所有潜在的匹配词信息注入到单字表示中,在多个领域的中文NER数据集上取得了性能提升,同时,该研究带动了词表信息融合的研究热潮。特别地,PLTE和FLAT基于Transformer框架分别设计了两种词信息融合方式。PLTE以transformer encoder为基础,能够并行地批量处理对所有字符和匹配的词典词信息的建模。除此之外,它还添加了位置关系表示,引进了一种多孔机制增强局部性的建模和维持捕捉长期依赖的能力,赋予了字向量更丰富的语义信息,在多个数据集上均取得了性能提升。FLAT则是将与当前输入文本匹配的所有潜在词拼接到输入文本之后,将原始的单字序列输入文本扩展为字词序列,即将栅格结构展平为跨度,进而基于Transformer的自注意力机制和跨度的相对位置编码,使每个字符能够直接与潜在匹配词交互,从而提升 NER模型性能。MECT则在FLAT基础之上,针对汉字是象形文字的特点,将带有汉字语义信息的Radical(偏旁部首)也融入到字向量中,并使用了一个Cross-Transformer网络模块来交互式的融合Lattice embedding与Radical embedding以增强语义信息。

尽管有以上各种工作来融入词汇以及增强语义信息,但是,中文的字音和字形是两个非常重要的信息,它们在语言理解任务中携带了重要的句法和语义信息。到目前为止,还没有方法将这两个重要信息完整的融入到NER方法中。

发明内容

本发明的目的是针对当前的NER工作往往会忽略汉字中的字音和字形两个重要信息,为了解决如何将字音和字形这两个重要信息有效融入NER方法中的技术问题,创造性地提出一种多模态信息选择性融合的中文命名实体识别方法。能够更好地动态融合字符、字音和字形三者之间的语义信息。

本发明的创新点在于:在NER(命名实体识别)的输入中,加入携带语义信息的字符的拼音与偏旁部首序列。使用CNN(Convolutional Neural Network) 网络对汉字的字音(Pinyin,也就是拼音),以及字形(Radical,也就是偏旁部首)进行编码,再经过Cross-Transformer网络的交互式嵌入之后,采用选择性融合,能够动态的生成不同模态信息的融合权重。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210810750.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top