[发明专利]实体与属性关系的动态抽取方法、服务器及可读存储介质有效

专利信息
申请号: 201711389560.0 申请日: 2017-12-21
公开(公告)号: CN108399157B 公开(公告)日: 2023-08-18
发明(设计)人: 陈虹;董振江;王宇;龚乐君;李涛 申请(专利权)人: 中兴通讯股份有限公司;南京邮电大学
主分类号: G06F40/295 分类号: G06F40/295;G06F40/30
代理公司: 北京天昊联合知识产权代理有限公司 11112 代理人: 姜春咸;冯建基
地址: 518000 广东省深圳市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 实体 属性 关系 动态 抽取 方法 服务器 可读 存储 介质
【说明书】:

发明公开了一种实体与属性关系的动态抽取方法,该方法包括:获取文本数据;基于动态实体属性关系库和训练模型,从文本数据中动态抽取实体与属性的各项特征。此外,本发明还提供了一种服务器及可读存储介质,采用本发明构建了动态的实体属性关系库和训练模型,并能够从文本数据中自动地抽取实体与属性的各项特征。

技术领域

本发明互联网技术领域,尤其涉及实体与属性关系的动态抽取方法、服 务器及可读存储介质。

背景技术

伴随着互联网的迅猛发展及大数据信息时代的来临,在一些特定领域中, 例如:电信领域中的技术和业务面临技术升级、业务更新的机遇与挑战,产 生了大量的知识和专用术语,成为名副其实的知识高度密信的行业。电信领 域中信息量增长,并已形成一个非常庞大而无序的信息资源库,其中非结构 化或半结构化的文本数据中携带着丰富的有价值的电信信息。命名实体是文 本中承载信息的重要语言单位,是获取有价值信息的必不可少的环节,不同 的实体具有不同的属性,同一类实体具有大致相同的属性,只是属性值有所 不同。

命名实体识别包括对实体的识别及属性的抽取。通用领域中实体识别是 把文本中的实体划为某一语义类型。现有的方法主要有三种方法,即:基于 字典、基于统计与基于规则的方法。其中,

基于字典的方法主要是通过字符串匹配找寻词库中命名实体,但是通常 没有一个全面的实体库,而且比对费时。

基于规则算法主要在实体识别过程中加入词法规则、语法规则、语义规 则,通过规则匹配的方法识别各种类型的命名实体。然而,基于规则方法受 限于人工添加规则。

基于统计的方法利用人工标注或原始语料进行训练。而基于统计的方法 需要先建立语言模型,然后在训练数据上估算模型参数,这有利于移植到不 同的语言及新领域。基于统计的方法主要利用一些统计模型如隐马尔可夫模 型、最大熵模型、支持向量机、条件随机场等。属性抽取的任务是为每个实 体语义类构造属性表并抽取出属性值。属性抽取的方法主要由模式匹配及基 于统计的方法,但是,当前这方面的研究远远少于实体识别。所以,在现有 技术中,抽取实体与属性关系的技术仍存在不足和缺陷。

发明内容

本发明的主要目的在于提出一种实体与属性关系的动态抽取方法、服务 器与可读存储介质,旨在解决特定技术领域的知识库和语料不健全的问题。

为实现上述目的,本发明提供的一种实体与属性关系的动态抽取方法, 所述方法包括步骤:

获取文本数据;

基于动态实体属性关系库和训练模型,从所述文本数据中动态抽取实体 与属性的各项特征。

此外,为实现上述目的,本发明还提出一种服务器,所述服务器包括处 理器以及存储器;

所述处理器用于执行存储器中存储的实体与属性关系的动态抽取程序, 以实现上述的方法。

此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述 计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被 一个或者多个处理器执行,以实现上述的方法。

本发明提出的实体与属性关系的动态抽取方法、服务器与可读存储介质, 通过获取文本数据,基于动态实体属性关系库和训练模型,从文本数据中动 态抽取实体与属性的各项特征,从而构建了动态的实体属性关系库和训练模 型,并能够从文本数据中自动地抽取实体与属性的各项特征。

附图说明

图1为本申请第一实施例提供的实体与属性关系的动态抽取方法的流程 示意图;

图2为本申请第一实施例提供的实体与属性关系的动态抽取方法的另一 流程示意图一;

图3为本申请第一实施例提供的实体与属性关系的动态抽取方法的子流 程示意图一;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司;南京邮电大学,未经中兴通讯股份有限公司;南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711389560.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top