[发明专利]一种基于深度学习的信息技术数据实体属性抽取方法在审

申请号：	202010316616.5	申请日：	2020-04-21
公开（公告）号：	CN111914055A	公开（公告）日：	2020-11-10
发明（设计）人：	郭绍翠;杨旭;宋正强;孙维夫	申请（专利权）人：	烟台职业学院
主分类号：	G06F16/31	分类号：	G06F16/31;G06F16/35;G06F40/295;G06F16/332
代理公司：	深圳紫晴专利代理事务所(普通合伙) 44646	代理人：	付钦伟
地址：	264670 山东省烟台***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习信息技术数据实体属性抽取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度学习的信息技术数据实体属性抽取方法，其特征在于，包括以下具体步骤：

一、插入——将字或者词变成一个稠密的向量，一般认为待变成稠密向量的词与实体之间的位置是一个相对位置；

二、编码——对于关系识别来说，即包含卷积神经网络相关的，也包含运行相关的，把上下文的信息考虑进来。举例说明，一个脉冲耦合神经网络可通过两个实体把句子分为多个部分，每个部分分别做卷积神经网络的最大值池化，再经过Softmax分类器进行分类；

三、处理——处理器可以处理分辨出两个实体是由于哪个词分辨出是顾佣的关系；

四、判定——对定长的向量进行判定分类，主要是把两部分的一些模型的参数在底层被共享起来。

2.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法，其特征在于，将文本信息里的字或者词变成一个稠密的向量，便于取机器的识别。

3.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法，其特征在于，创建一个为待变成稠密向量的词与实体之间的位置。

4.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法，其特征在于，在获取对应位置的稠密向量后，使脉冲耦合神经网络通过两个实体把句子分为多个部分，每个部分分别做卷积神经网络的最大值池化。

5.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法，其特征在于，再将最大值池化的每个部分经过Softmax分类器进行分类，避免因直接对多个部分进行最大值池化造成数据信息的丢失，提高机器抽取的准确度。

6.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法，其特征在于，对编码后的两个实体进行处理，便于确定两个实体之间的从属关系。

7.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法，其特征在于，使机器进行层级关系的区分时，便于根据从属关系进行层级关系的辨别。

8.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法，其特征在于，便于在对不同长度的向量进行层级关系的分辨后，对定长的向量进行建模。

9.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法，其特征在于，便于使底层的模型参数可在外界设备命令需求时得到共享，便于提高机器数据抽取的速率。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于烟台职业学院，未经烟台职业学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010316616.5/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载