[发明专利]嵌套实体识别方法、装置、计算机设备及存储介质在审
申请号: | 202110682529.6 | 申请日: | 2021-06-17 |
公开(公告)号: | CN113326701A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 王锋;郭东波;叶朝鹏;石志伟 | 申请(专利权)人: | 广州华多网络科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/35;G06F40/126 |
代理公司: | 广州利能知识产权代理事务所(普通合伙) 44673 | 代理人: | 王增鑫 |
地址: | 511442 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 嵌套 实体 识别 方法 装置 计算机 设备 存储 介质 | ||
1.一种嵌套实体识别方法,其特征在于,包括:
获取待识别的目标语句;
根据预设的编码规则对所述目标语句进行编码处理,生成所述目标语句的序列向量;
将所述序列向量输入至预设的实体识别模型中,其中,所述实体识别模型为预先训练至收敛状态,用于识别文字信息中实体词语指针的神经网络模型;
读取所述实体识别模型输出的多个实体词语指针,并基于预设的至少两个分类类别,计算各分类类别与各实体词语指针之间的置信度;
根据所述置信度确定所述各分类类别对应的实体词语指针,并生成所述各分类类别的分类结果。
2.根据权利要求1所述的嵌套实体识别方法,其特征在于,所述获取待识别的目标语句包括:
采集目标用户的用户信息、商品信息和/或用户行为信息;
将所述用户信息、商品信息和/或用户行为信息通过文字信息进行描述生成所述目标语句。
3.根据权利要求1所述的嵌套实体识别方法,其特征在于,所述序列向量包括词语向量,所述根据预设的编码规则对所述目标语句进行编码处理,生成所述目标语句的序列向量包括:
根据所述目标语句,确定所述目标语句的多个语句变量;
根据各语句变量生成所述目标语句对应的语句矩阵,并将所述各语句变量以二进制的方式嵌入至所述语句矩阵中,生成所述目标语句的词语向量。
4.根据权利要求3所述的嵌套实体识别方法,其特征在于,所述序列向量包括位置向量,所述根据预设的编码规则对所述目标语句进行编码处理,生成所述目标语句的序列向量包括:
获取所述各语句变量的位置信息,其中,所述位置信息包括所述各语句变量之间的相对位置信息;
根据预设的旋转式位置编码对所述位置信息进行编码,生成所述各语句变量对应的绝对位置信息,其中,所述各语句变量的绝对位置信息通过所述位置信息进行表达;
基于所述绝对位置信息,生成所述目标语句的位置向量。
5.根据权利要求1所述的嵌套实体识别方法,其特征在于,所述读取所述实体识别模型输出的多个实体词语指针,并基于预设的至少两个分类类别,计算各分类类别与各实体词语指针之间的置信度包括:
提取预设的至少两个分类类别;
根据所述实体识别模型的损失函数,计算所述各分类类别与所述多个实体词语指针之间的特征距离;
基于预设的sigmoid函数和所述特征距离,计算所述各分类类别与各实体词语指针之间的置信度。
6.根据权利要求1所述的嵌套实体识别方法,其特征在于,所述根据所述置信度确定所述各分类类别对应的实体词语指针,并生成所述各分类类别的分类结果包括:
将所述各分类类别中对应置信度最大的实体词语指针,确定为对应分类类别的实体词语指针;
在所述目标语句中提取与所述实体词语指针对应的实体词语;
根据所述实体词语生成所述各分类类别的分类结果。
7.根据权利要求1-6任意一项所述的嵌套实体识别方法,其特征在于,所述实体识别模型还包括损失函数,所述损失函数的特征描述为:
其中,所述Pα表示所述目标语句的中类型为α的实体词语指针集合,Qα表示所述目标语句非实体词语或者类型非α的实体的词语指针集合,切i≤j的组合。
8.一种嵌套实体识别装置,其特征在于,所述嵌套实体识别装置包括:
获取模块,用于获取待识别的目标语句;
处理模块,用于根据预设的编码规则对所述目标语句进行编码处理,生成所述目标语句的序列向量;
分类模块,用于将所述序列向量输入至预设的实体识别模型中,其中,所述实体识别模型为预先训练至收敛状态,用于识别文字信息中实体词语的神经网络模型;
计算模块,用于读取所述实体识别模型输出的多个实体词语指针,并基于预设的至少两个分类类别,计算各分类类别与各实体词语指针之间的置信度;
执行模块,用于根据所述置信度确定所述各分类类别对应的实体词语指针,并生成所述各分类类别的分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华多网络科技有限公司,未经广州华多网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110682529.6/1.html,转载请声明来源钻瓜专利网。