[发明专利]一种基于全文注意力机制的商品名称识别方法有效

专利信息
申请号: 201810768223.0 申请日: 2018-07-13
公开(公告)号: CN109062893B 公开(公告)日: 2021-09-21
发明(设计)人: 苏锦钿;李鹏飞;周炀 申请(专利权)人: 华南理工大学
主分类号: G06F40/289 分类号: G06F40/289;G06F40/295;G06N3/08
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 李斌
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 全文 注意力 机制 商品名称 识别 方法
【说明书】:

发明公开了一种基于全文注意力机制的商品名称识别方法,包括:建立加入全文注意力机制的深度神经网络模型,在深度神经网络模型中加入全文注意力层,在全文注意力层当中,将全文的信息用词嵌入向量的方法来表示;接着,对于要标注的每一个词语,计算它们和全文注意力层词向量的相似性,从而让词语获得对全文的“注意力权重”,即让词语关注到文档的上下文信息,利用注意力权重和,计算出每一个词语的额外特征,用以进行商品名称的识别。本发明方法能够有效的从不规则的文本中提取出商品名,并解决了同一种商品在上下文识别不一致的问题,提高了识别的准确率。

技术领域

本发明涉及自然语言处理技术领域,特别涉及一种基于全文注意力机制的商品名称识别方法。

背景技术

命名实体识别是信息抽取的一项子任务,旨在识别出文本中的专有名词,并对它们进行分类。传统的命名实体任务有:人名、地名、机构名等。这是自然语言处理领域中一个相当重要的基础任务,比如:搜索引擎、问答系统、推荐系统、翻译系统等。而近年来,随着电子商务的不断发展,针对电商领域的命名实体识别任务也开始为人们所关注,人们迫切需要从海量的、不规则的文本中提取出商品的名称,并将其用于智能客服、广告推荐等领域。

对于这个问题,经典的研究主要是基于归纳商品字典、完善正则表达式、界定规、构造隐马尔科夫模型、构造最大熵模型和构造条件随机场模型等方法,这些方法的缺点在于,它们无法对词语潜在的语义进行建模,只能通过增加外部特征来达到提升效果的目的。

而近几年来,随着深度学习的不断发展,很多学者开始利用深层神经网络来对文本建模,这些模型能够捕获到文本潜在的语义信息,大大减少了人工提取特征的工作量,具体到商品名称识别,目前较好的模型有BI-LSTM+CRF模型,CNN+CRF模型,这些模型基本上都是用了word-embedding技术,这能解决词典高维稀疏的问题,具有很强的泛化能力,使得我们不必统计完整的商品词典,同时,神经网络和CRF的结合,能够解决商品名识别标注矛盾的问题,提高识别准确率。然而,这些研究忽略了商品名识别不一致的问题,也就是说,同一个商品,在文本中的不同位置,被识别成了不同的类别。比如,“苹果”和“苹果手机”同时都在一篇文档中出现,但是如果应用上面所说的模型,有可能“苹果”被标注成水果,“苹果手机”则被标注成商品,出现这个问题的原因在于,模型并没有考虑到文档全文的信息,如果知道这篇文章是在讲手机相关的内容,那么“苹果”更大概率是一种商品。因此,提供一种基于全文注意力机制的商品名称识别方法,具有重要的现实意义。

发明内容

本发明的目的在于克服现有技术的缺点与不足,提供一种基于全文注意力机制的商品名称识别方法,基于深度学习技术,能够有效的从不规则的文本中提取出商品名,并解决了同一种商品在上下文识别不一致的问题,提高了识别的准确率。

本发明的目的通过以下的技术方案实现:一种基于全文注意力机制的商品名称识别方法,包括:建立加入全文注意力机制的深度神经网络模型,在深度神经网络模型中加入全文注意力层,在全文注意力层当中,将全文的信息用词嵌入向量的方法来表示;接着,对于要标注的每一个词语,计算它们和全文注意力层词向量的相似性,从而让词语获得对全文的“注意力权重”,即让词语关注到文档的上下文信息,利用注意力权重和,计算出每一个词语的额外特征,用以进行商品名称的识别。

优选的,加入全文注意力机制的深度神经网络模型包括:输入层、编码层、全文注意力层、输出层、提取层;

第一层是输入层,首先利用预训练好的词向量,将全文分词后的结果映射为向量矩阵,并将额外的词性信息编码为one-hot特征,拼接在向量矩阵后,形成模型的输入;

第二层是编码层,针对文章中的每一个句子,使用双向循环神经网络来进行编码;

第三层是全文注意力层,由于第二层已经对文中的每一个句子进行了建模,全文注意力层的任务是为每一个词语引入全文的信息,得到蕴含更多信息的编码;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810768223.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top