[发明专利]一种基于深度学习的信息技术数据实体属性抽取方法在审
| 申请号: | 202010316616.5 | 申请日: | 2020-04-21 |
| 公开(公告)号: | CN111914055A | 公开(公告)日: | 2020-11-10 |
| 发明(设计)人: | 郭绍翠;杨旭;宋正强;孙维夫 | 申请(专利权)人: | 烟台职业学院 |
| 主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/35;G06F40/295;G06F16/332 |
| 代理公司: | 深圳紫晴专利代理事务所(普通合伙) 44646 | 代理人: | 付钦伟 |
| 地址: | 264670 山东省烟台*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 信息技术 数据 实体 属性 抽取 方法 | ||
1.一种基于深度学习的信息技术数据实体属性抽取方法,其特征在于,包括以下具体步骤:
一、插入——将字或者词变成一个稠密的向量,一般认为待变成稠密向量的词与实体之间的位置是一个相对位置;
二、编码——对于关系识别来说,即包含卷积神经网络相关的,也包含运行相关的,把上下文的信息考虑进来。举例说明,一个脉冲耦合神经网络可通过两个实体把句子分为多个部分,每个部分分别做卷积神经网络的最大值池化,再经过Softmax分类器进行分类;
三、处理——处理器可以处理分辨出两个实体是由于哪个词分辨出是顾佣的关系;
四、判定——对定长的向量进行判定分类,主要是把两部分的一些模型的参数在底层被共享起来。
2.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法,其特征在于,将文本信息里的字或者词变成一个稠密的向量,便于取机器的识别。
3.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法,其特征在于,创建一个为待变成稠密向量的词与实体之间的位置。
4.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法,其特征在于,在获取对应位置的稠密向量后,使脉冲耦合神经网络通过两个实体把句子分为多个部分,每个部分分别做卷积神经网络的最大值池化。
5.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法,其特征在于,再将最大值池化的每个部分经过Softmax分类器进行分类,避免因直接对多个部分进行最大值池化造成数据信息的丢失,提高机器抽取的准确度。
6.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法,其特征在于,对编码后的两个实体进行处理,便于确定两个实体之间的从属关系。
7.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法,其特征在于,使机器进行层级关系的区分时,便于根据从属关系进行层级关系的辨别。
8.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法,其特征在于,便于在对不同长度的向量进行层级关系的分辨后,对定长的向量进行建模。
9.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法,其特征在于,便于使底层的模型参数可在外界设备命令需求时得到共享,便于提高机器数据抽取的速率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于烟台职业学院,未经烟台职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010316616.5/1.html,转载请声明来源钻瓜专利网。





