首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于边界检测的中文命名实体识别方法在审

申请号：	202210532724.5	申请日：	2022-05-11
公开（公告）号：	CN114818713A	公开（公告）日：	2022-07-29
发明（设计）人：	朱广丽;王腾科;张顺香;刘云朵;谈光璞;韦斯羽;张玉莹;张友强;王星光;马子晨;李瀚臣;高茂娇	申请（专利权）人：	安徽理工大学
主分类号：	G06F40/295	分类号：	G06F40/295;G06F16/35;G06N3/04
代理公司：	暂无信息	代理人：	暂无信息
地址：	232001 安徽***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于边界检测中文命名实体识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于边界检测的中文命名实体识别方法，其特征在于，包括如下步骤：

步骤1：对目标文本处理和多粒度表示，其基本步骤如下：

步骤1.1：将所述目标文本根据标点符号进行切分，得到句粒度文本；

步骤1.2：对处理后的句粒度文本进行字粒度嵌入向量表示，得到字粒度嵌入向量

步骤1.3：同时对句粒度文本进行分词，对分词结果进行词粒度嵌入向量表示，得到词粒度嵌入向量

步骤1.4：将所述的字粒度嵌入向量和词粒度嵌入向量进行融合得到多粒度嵌入向量e_i；

步骤2：将多粒度嵌入表示e_i输入BiGRU，得到第i位置的上下文信息h_i。其中，BiGRU是由前向GRU和后向GRU组成，即第i位置的上下文隐藏信息h_i由前向GRU和后向GRU的输出拼接而成。

步骤3：利用神经网络对每个时刻的上下文信息h_i进行解码，判断h_i所代表的位置i是否为实体的开始位置或者结束位置，其基本步骤如下：

步骤3.1：神经网络指的是多层感知机和Sigmoid激活函数，对每一个位置上的隐藏信息h_i进行解码指的是利用多层感知机提取隐藏信息h_i的边界信息；

步骤3.2：Sigmoid输出最后的结果，即该位置是实体的开始位置或结束位置的可能性，用P_i^B和P_i^E这两种标签值分别表示；

步骤3.3：使用log似然函数作为训练开始位置和结束位置这两种标签的损失函数，用表示开始位置的损失函数，用表示结束位置的损失函数；

步骤3.4：公式联合和这两中损失来优化最终的预测结果。

步骤4：利用贪婪算法将每个实体边界位置尽可能地组装出候选实体，并共享步骤2中的上下文信息表示候选实体，其基本步骤如下：

步骤4.1：利用右贪心匹配，通过边界检测得到的每个开始边界贪婪地匹配右侧n个结束边界，得到多个候选实体；

步骤4.2：共享来自步骤2中BiGRU输出的上下文信息来表示候选实体，即候选实体E_ij＝[h_i,...,h_j]。

步骤5：利用实体分类器对候选实体进行细粒度化处理，识别实体类型，完成命名实体识别，其内容如下：

使用多层感知机加Softmax激活函数作为实体分类器并预测实体的类别标签。训练过程中的损失是所有标签损失的和，损失函数的计算方式是交叉熵损失函数。

2.根据权利要求1所述的对目标文本处理和多粒度表示，其特征在于，其中的字粒度嵌入表示和词粒度嵌入表示，包括：

利用Word2Vec预训练模型，对所述句中的字和词进行嵌入向量表示，得到字粒度和词粒度嵌入向量表示。

3.根据权利要求1所述的对目标文本处理和多粒度表示，其特征在于，在步骤1.4中将所述的字粒度和词粒度的嵌入向量以向量拼接的融合方式得到多粒度嵌入向量，包括：

假设输入的句子为T＝{T₁,T₂,…,T_n}，我们使用表示第i个字粒度标记，使用表示由第j个字到第k个字组成的中文词语的词粒度标记。第i个字的多粒度嵌入向量e_i由和以向量拼接的方式融合得到。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于安徽理工大学，未经安徽理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210532724.5/1.html，转载请声明来源钻瓜专利网。

上一篇：一种相变换热装置
下一篇：一种多孔光催化剂及其制备方法和应用

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top