[发明专利]一种基于深度学习的电力舆情实体关系抽取方法及系统有效
申请号: | 202310498522.8 | 申请日: | 2023-05-06 |
公开(公告)号: | CN116227496B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 张强;周飞;付慧;宋博川;刘同阳;马径坦 | 申请(专利权)人: | 国网智能电网研究院有限公司;国网江苏省电力有限公司;国家电网有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06F16/35;G06N3/0442;G06N3/0455;G06N3/048;G06N3/08;G06F18/25;G06Q50/06 |
代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
地址: | 102299 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 电力 舆情 实体 关系 抽取 方法 系统 | ||
本发明涉及自然语言处理技术领域,具体提供了一种基于深度学习的电力舆情实体关系抽取方法及系统,包括:将电力舆情文本作为预先构建的关系抽取模型的输入,得到所述预先构建的关系抽取模型输出的电力舆情文本的关系特征标注结果;获取电力舆情文本的属性特征,并将所述属性特征和关系特征标注结果作为预先构建的实体关系抽取模型的输入,得到所述预先构建的实体关系抽取模型输出的电力舆情文本的实体关系标注结果。本发明提供的技术方案,可以有效的从电力舆情文本中自动的将包含的实体内容与实体之间的关系抽取出来。
技术领域
本发明涉及自然语言处理技术领域,具体涉及一种基于深度学习的电力舆情实体关系抽取方法及系统。
背景技术
随着网络技术的发展,每天会产生大量的文本数据,人们需要处理的数据量呈现爆炸性激增的趋势。在文本数据的研究中,信息抽取作为一种基本的文本处理方式,主要有三个子任务:实体识别、关系抽取和事件抽取。在自然语言处理领域,实体关系抽取是信息抽取、信息检索中的核心任务和重要的环节,即从文本中抽取出其中包含的实体内容以及实体之间的关系。
在进行实体关系抽取的过程中,有众多的学者通过多种的相关技术在该领域进行深入的研究,其中经典的实体关系抽取方法有监督、半监督、弱监督和无监督的实体关系抽取方法,但是经典的方法在特征的提取方面是存在误差传播的情况,这些问题的存在极大的影响着实体关系抽取的一个结果。
发明内容
为了克服上述缺陷,本发明提出了一种基于深度学习的电力舆情实体关系抽取方法及系统。
第一方面,提供一种基于深度学习的电力舆情实体关系抽取方法,所述基于深度学习的电力舆情实体关系抽取方法包括:
将电力舆情文本作为预先构建的关系抽取模型的输入,得到所述预先构建的关系抽取模型输出的电力舆情文本的关系特征标注结果;
获取电力舆情文本的属性特征,并将所述属性特征和关系特征标注结果作为预先构建的实体关系抽取模型的输入,得到所述预先构建的实体关系抽取模型输出的电力舆情文本的实体关系标注结果。
优选的,所述方法还包括:
将所述属性特征作为预先构建的实体抽取模型的输入,得到所述预先构建的实体抽取模型输出的电力舆情文本的实体标注结果;
判断所述电力舆情文本的实体关系标注结果标注出的实体集合是否属于所述电力舆情文本的实体标注结果中标注出的实体集合,若是,则所述电力舆情文本的实体关系标注结果正确,否则,删除所述电力舆情文本的实体关系标注结果中不属于所述电力舆情文本的实体标注结果中标注出的实体集合的标注。
优选的,所述属性特征包括下述中的至少一种:五笔顺序对应的One-Hot编码、偏旁部首对应的One-Hot编码、拼音向量对应的One-Hot编码、BERT特征。
进一步的,所述BERT特征的获取过程包括:将所述电力舆情文本代入BERT模型进行特征提取,得到BERT模型输出的BERT特征。
进一步的,所述预先构建的关系抽取模型包括:依次连接的BERT模型、全连接层和sigmoid激活函层;
所述预先构建的实体抽取模型包括:依次连接的第一特征融合层、第一双向长短时记忆网络和第一条件随机场模型;
所述预先构建的实体关系抽取模型包括:依次连接的第二特征融合层、第二双向长短时记忆网络和第二条件随机场模型;
所述第一特征融合层,用于将所述属性特征进行特征融合,得到第一融合特征;
所述第二特征融合层,用于将所述属性特征和关系特征标注结果进行特征融合,得到第二融合特征。
进一步的,所述预先构建的关系抽取模型的获取过程包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网智能电网研究院有限公司;国网江苏省电力有限公司;国家电网有限公司,未经国网智能电网研究院有限公司;国网江苏省电力有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310498522.8/2.html,转载请声明来源钻瓜专利网。