[发明专利]一种实体关系抽取方法、系统、设备及可读存储介质在审
| 申请号: | 202211027598.4 | 申请日: | 2022-08-25 |
| 公开(公告)号: | CN115600595A | 公开(公告)日: | 2023-01-13 |
| 发明(设计)人: | 钱雪忠;江旭 | 申请(专利权)人: | 江南大学 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/126;G06F40/30;G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 陈华红子 |
| 地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 实体 关系 抽取 方法 系统 设备 可读 存储 介质 | ||
1.一种实体关系抽取方法,其特征在于,包括:
将待进行实体关系抽取的句子输入训练好的实体关系抽取模型中,利用所述实体关系抽取模型中的word2vec网络提取句子的特征输入向量;
将所述句子的特征输入向量输入到所述实体关系抽取模型中的PCNN特征提取网络中提取句子的局部特征向量;
将所述句子的局部特征向量输入到所述实体关系抽取模型中的BiGRU神经网络中进行双向学习得到句子的目标特征向量;
将所述句子的目标特征向量输入所述实体关系抽取模型中的多分支注意力机制计算句子的目标特征向量权重值;
使用所述实体关系抽取模型中的softmax函数根据所述句子的目标特征向量权重值对句子的实体关系进行分类,得到句子中每个词被选作实体关系的概率。
2.根据权利要求1所述的实体关系抽取方法,其特征在于,所述利用所述实体关系抽取模型中的word2vec网络提取句子的特征输入向量包括:
获取待进行实体关系抽取的句子的输入文本序列S={w1,w2,...,wl},其中,wi表示句子中第i个单词的编码,l表示句子的长度;
将所述输入文本序列输入到word2vec网络中,输出维度为dp的词向量,并根据所述词向量得到句子中第一实体到句子中每个词距离的文本序列M={p1,p2,......,pm}和句子中第二实体到句子中每个词距离的文本序列N={p1,p2,......,pn};
将所述文本序列M和文本序列N分别输入到word2vec网络中,输出两个维度为dt的词向量;
将维度为dp的词向量和两个维度为dt的词向量拼接得到维度为dp+2dt的特征输入向量。
3.根据权利要求1所述的实体关系抽取方法,其特征在于,所述将所述句子的局部特征向量输入到所述实体关系抽取模型中的BiGRU神经网络中进行双向学习得到句子的目标特征向量的计算公式为:
zt=σ(Wz*[ht-1,xt]),
rt=σ(Wr*[ht-1,xt]),
其中,rt是复位门,zt是更新门,xt是输入数据,Wz、Wr、W分别是重置门、更新门、候选隐藏状态的权重矩阵,σ是一个sigmoid函数,为候选隐藏状态的输出,ht是当前时刻的输出,ht-1是上一时刻的输出,为后向学习得到的特征向量,为前向学习得到的特征向量,为目标特征向量。
4.根据权利要求3所述的实体关系抽取方法,其特征在于,所述将所述句子的目标特征向量输入所述实体关系抽取模型中的多分支注意力机制计算句子的目标特征向量权重值包括:
计算句子的目标特征输入向量在t时刻的权重,其计算公式为:
其中,βi为初始化特征参数,为目标特征向量,Zt为句子的目标特征向量在t时刻的权重;
对句子的目标特征向量1至t时刻的权重求和得到句子的目标特征向量权重值,其计算公式为:
其中,j={1,2,3,......,t},Z为句子的目标特征向量权重值。
5.根据权利要求4所述的实体关系抽取方法,其特征在于,所述句子中每个词被选作实体关系的概率的计算公式为:
其中,P(k)为句子中第k个词被选作实体关系的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211027598.4/1.html,转载请声明来源钻瓜专利网。





