[发明专利]一种融合文本语法结构和语义信息的文本实体关系自动分类方法在审

申请号：	201911345630.1	申请日：	2019-12-24
公开（公告）号：	CN111177383A	公开（公告）日：	2020-05-19
发明（设计）人：	陈雪;陈光勇;骆祥峰;黄敬;王鹏	申请（专利权）人：	上海大学;阿里巴巴集团控股有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06F40/211;G06F40/295;G06F40/30;G06N3/02
代理公司：	上海上大专利事务所(普通合伙) 31205	代理人：	陆聪明
地址：	200444***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种融合文本语法结构语义信息实体关系自动分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种融合文本语法结构和语义信息的文本实体关系自动分类方法，其特征在于，具体步骤如下：

(1)获取互联网公开的文本集信息并进行预处理，得到句子的初始向量；

(2)从步骤(1)得到的句子初始向量中，提取句中词语与实体及关系的相关度，更新句子向量；

(3)将步骤(2)得到的句子向量输入到双向门循环单元神经网络，得到融合语义信息的句子向量；

(4)将步骤(2)得到的句子向量输入到图注意力神经网络，得到融合语法结构信息的句子向量；

(5)对每个句子，将步骤(3)得到的融合语义信息的句子向量和步骤(4)得到的融合语法结构信息的句子向量进行拼接，更新句子向量；

(6)将步骤(5)得到的句子向量输入到全连接神经网络层，得到句子的特征向量；该特征向量经过softmax变换输出实体关系分类向量，其每一维表示句中实体关系属于对应类别的概率。

2.根据权利要求1所述的融合文本语法结构和语义信息的文本实体关系自动分类方法，其特征在于，所述步骤(1)中获取互联网公开的文本训练集信息并进行预处理，得到句子的初始向量，其过程如下：

对词语缩写形式还原；使用StandfordCoreNLP工具对数据文本进行切分词，词性标注、去除文本中的副词，形容词；构建句子词汇间的邻接矩阵和依存语法分析树；利用glove词向量映射出句子中每个词语的向量表示，得到句子的初始向量S₀＝{w₁,w₂,…,w_n}，其中n为句子的最大长度，w_i为句中每个词的向量，维度为300维。

3.根据权利要求1所述的融合文本语法结构和语义信息的文本实体关系自动分类方法，其特征在于，所述步骤(2)中从步骤(1)得到的句子初始向量中提取句中词语与实体及关系的相关度，其过程如下：

(2-1)依照步骤(1)输出的句子向量分S₀＝{w₁,w₂,…,w_n}，输入句中词语与两个实体的所构建的相对位置矩阵E1_pos和E2_pos，E1_pos为句中词语与实体1的相对位置，E1_pos＝{pos₁,pos₂,…,pos_n}，实体1在句中的位置e₁，则pos_i＝i-e₁，把pos_i重新映射到预设维度为20的张量上，其中张量采用均匀分布随机初始化生成；同理计算实体2相对位置矩阵E2_pos，将S₀、E1_pos和E2_pos进行拼接，得到更新后的S₀，其维度为340；

(2-2)从(2-1)更新后的S₀中抽取出代表实体1、实体2和关系的向量化表示分别为w_e1、w_e2与w_r；计算A_e1＝f(S₀,w_e1)，其中f为矩阵的内积运算，A_e1为句子中每个词语与实体1所计算出的相关度，A_e1＝{a₁,a₂,…,a_n}，a_i为句中第i词语与实体1的相关度表示；同理构造A_e2和A_r，三者的维度均为句子的长度n；对A_e1、A_e2和A_r三个向量的各个分量分别使用如下softmax进行归一化处理后得到三个新的向量A₁，A₂和A₃：

把A₁，A₂和A₃三个向量各个对应分量求和取平均得到句子的词语与实体及关系的相关度句子向量更新计算公式为S₀＝A×S₀。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海大学;阿里巴巴集团控股有限公司，未经上海大学;阿里巴巴集团控股有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911345630.1/1.html，转载请声明来源钻瓜专利网。

上一篇：智能化脚本配置方法、装置及计算机可读存储介质
下一篇：基于多级总线的飞机驾驶舱指示灯驱动装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种融合文本语法结构和语义信息的文本实体关系自动分类方法在审

专利文献下载