[发明专利]实体名称识别方法、装置、设备及存储介质有效

专利信息
申请号: 202010024497.6 申请日: 2020-01-09
公开(公告)号: CN111241826B 公开(公告)日: 2023-07-25
发明(设计)人: 李超;吴海山;殷磊;伍德意;程善钿 申请(专利权)人: 深圳前海微众银行股份有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06F40/289;G06F16/36;G06N3/0464;G06N3/045;G06N3/08;G06Q40/00
代理公司: 深圳市世纪恒程知识产权代理事务所 44287 代理人: 王韬
地址: 518000 广东省深圳市前海深港合作区前*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 实体 名称 识别 方法 装置 设备 存储 介质
【说明书】:

发明涉及金融科技领域,公开了实体名称识别方法、装置、设备及存储介质,所述方法包括:获取待检测文本,并获取所述待检测文本的多个实体名称;在预设的知识节点图谱中确定各实体名称对应的实体节点,若根据所述知识节点图谱确定各实体节点之间不存在第一统一实体,则获取各实体节点的节点权重特征、互联网词汇嵌入特征和目标文本词汇嵌入特征;对各实体节点的所述节点权重特征、所述互联网词汇嵌入特征和所述目标文本词汇嵌入特征进行特征提取,并根据特征提取结果确定各实体节点的第二统一实体;输出所述第二统一实体的第二统一实体名称。本发明解决传统命名提取方法中实体命名的识别匹配率低下,无法实现实体融合统一的技术问题。

技术领域

本发明涉及金融科技技术领域,尤其涉及一种实体名称识别方法、装置、设备及存储介质。

背景技术

随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域,传统金融工业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。

命名实体识别(NER,Name Entity Recognition)是深度学习领域较成熟的应用,其作用是将文本里面与业务相关的目标主体(例如人名、企业名、地理位置等)提取位置信息并进行分类。但是现有的提取方法存在实体融合问题,即同一实体在所提取的命名中可能存在名称不统一的问题,从而导致实体命名的识别匹配率低下,无法实现实体融合统一。

因此,如何提高实体命名的识别匹配率,实现实体的融合统一,是当前亟待解决的技术问题。

发明内容

本发明的主要目的在于提供一种实体名称识别方法、装置、设备及存储介质,旨在解决传统命名提取方法中实体命名的识别匹配率低下,无法实现实体融合统一的技术问题。

为实现上述目的,本发明实施例提供一种实体名称识别方法,所述实体名称识别方法包括:

获取待检测文本,并获取所述待检测文本的多个实体名称;

在预设的知识节点图谱中确定各实体名称对应的实体节点,若根据所述知识节点图谱确定各实体节点之间不存在第一统一实体,则获取各实体节点的节点权重特征、互联网词汇嵌入特征和目标文本词汇嵌入特征;

对各实体节点的所述节点权重特征、所述互联网词汇嵌入特征和所述目标文本词汇嵌入特征进行特征提取,并根据特征提取结果确定各实体节点的第二统一实体;

输出所述第二统一实体的第二统一实体名称。

可选地,所述获取各实体节点的节点权重特征、互联网词汇嵌入特征和目标文本词汇嵌入特征,包括:

对所述实体节点进行特征预测,以获得节点权重特征;

对所述实体节点进行特征检索,以获得各实体节点对应的关联文本,并对所述关联文本进行特征化处理,以获得互联网词汇嵌入特征;

对所述实体节点和所述关联文本进行语句特征提取,以获取目标文本词汇嵌入特征。

可选地,所述对各实体节点的所述节点权重特征、所述互联网词汇嵌入特征和所述目标文本词汇嵌入特征进行特征提取,并根据特征提取结果确定各实体节点的第二统一实体包括:

基于各实体节点以及各实体节点的所述节点权重特征、所述互联网词汇嵌入特征和所述目标文本词汇嵌入特征,生成各实体节点的特征值;

根据各实体节点的特征值,分别确定两两实体节点之间的特征相似值;

将所述数值最大的特征相似值对应的两个目标实体节点确定为第二统一实体,并将两个目标实体节点中的其中任一目标实体节点的实体名称作为所述第二统一实体的第二统一实体名称。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010024497.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top