[发明专利]嵌套实体识别方法、装置、计算机设备及存储介质在审

专利信息
申请号: 202110682529.6 申请日: 2021-06-17
公开(公告)号: CN113326701A 公开(公告)日: 2021-08-31
发明(设计)人: 王锋;郭东波;叶朝鹏;石志伟 申请(专利权)人: 广州华多网络科技有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06F16/35;G06F40/126
代理公司: 广州利能知识产权代理事务所(普通合伙) 44673 代理人: 王增鑫
地址: 511442 广东省广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 嵌套 实体 识别 方法 装置 计算机 设备 存储 介质
【权利要求书】:

1.一种嵌套实体识别方法,其特征在于,包括:

获取待识别的目标语句;

根据预设的编码规则对所述目标语句进行编码处理,生成所述目标语句的序列向量;

将所述序列向量输入至预设的实体识别模型中,其中,所述实体识别模型为预先训练至收敛状态,用于识别文字信息中实体词语指针的神经网络模型;

读取所述实体识别模型输出的多个实体词语指针,并基于预设的至少两个分类类别,计算各分类类别与各实体词语指针之间的置信度;

根据所述置信度确定所述各分类类别对应的实体词语指针,并生成所述各分类类别的分类结果。

2.根据权利要求1所述的嵌套实体识别方法,其特征在于,所述获取待识别的目标语句包括:

采集目标用户的用户信息、商品信息和/或用户行为信息;

将所述用户信息、商品信息和/或用户行为信息通过文字信息进行描述生成所述目标语句。

3.根据权利要求1所述的嵌套实体识别方法,其特征在于,所述序列向量包括词语向量,所述根据预设的编码规则对所述目标语句进行编码处理,生成所述目标语句的序列向量包括:

根据所述目标语句,确定所述目标语句的多个语句变量;

根据各语句变量生成所述目标语句对应的语句矩阵,并将所述各语句变量以二进制的方式嵌入至所述语句矩阵中,生成所述目标语句的词语向量。

4.根据权利要求3所述的嵌套实体识别方法,其特征在于,所述序列向量包括位置向量,所述根据预设的编码规则对所述目标语句进行编码处理,生成所述目标语句的序列向量包括:

获取所述各语句变量的位置信息,其中,所述位置信息包括所述各语句变量之间的相对位置信息;

根据预设的旋转式位置编码对所述位置信息进行编码,生成所述各语句变量对应的绝对位置信息,其中,所述各语句变量的绝对位置信息通过所述位置信息进行表达;

基于所述绝对位置信息,生成所述目标语句的位置向量。

5.根据权利要求1所述的嵌套实体识别方法,其特征在于,所述读取所述实体识别模型输出的多个实体词语指针,并基于预设的至少两个分类类别,计算各分类类别与各实体词语指针之间的置信度包括:

提取预设的至少两个分类类别;

根据所述实体识别模型的损失函数,计算所述各分类类别与所述多个实体词语指针之间的特征距离;

基于预设的sigmoid函数和所述特征距离,计算所述各分类类别与各实体词语指针之间的置信度。

6.根据权利要求1所述的嵌套实体识别方法,其特征在于,所述根据所述置信度确定所述各分类类别对应的实体词语指针,并生成所述各分类类别的分类结果包括:

将所述各分类类别中对应置信度最大的实体词语指针,确定为对应分类类别的实体词语指针;

在所述目标语句中提取与所述实体词语指针对应的实体词语;

根据所述实体词语生成所述各分类类别的分类结果。

7.根据权利要求1-6任意一项所述的嵌套实体识别方法,其特征在于,所述实体识别模型还包括损失函数,所述损失函数的特征描述为:

其中,所述Pα表示所述目标语句的中类型为α的实体词语指针集合,Qα表示所述目标语句非实体词语或者类型非α的实体的词语指针集合,切i≤j的组合。

8.一种嵌套实体识别装置,其特征在于,所述嵌套实体识别装置包括:

获取模块,用于获取待识别的目标语句;

处理模块,用于根据预设的编码规则对所述目标语句进行编码处理,生成所述目标语句的序列向量;

分类模块,用于将所述序列向量输入至预设的实体识别模型中,其中,所述实体识别模型为预先训练至收敛状态,用于识别文字信息中实体词语的神经网络模型;

计算模块,用于读取所述实体识别模型输出的多个实体词语指针,并基于预设的至少两个分类类别,计算各分类类别与各实体词语指针之间的置信度;

执行模块,用于根据所述置信度确定所述各分类类别对应的实体词语指针,并生成所述各分类类别的分类结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华多网络科技有限公司,未经广州华多网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110682529.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top