[发明专利]一种面向电力规划评审领域的命名实体识别方法在审
| 申请号: | 202111485849.9 | 申请日: | 2021-12-07 |
| 公开(公告)号: | CN114154505A | 公开(公告)日: | 2022-03-08 |
| 发明(设计)人: | 罗劲瑭;姚实颖;冯渝荏;徐杰;杨宇玄;陈一鸣;曾鉴;祝和春;余葭苇;倪江;张晨琳 | 申请(专利权)人: | 国网四川省电力公司经济技术研究院 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06N3/04;G06N3/08 |
| 代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 张杨 |
| 地址: | 610000 四川省成都市中国(四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 电力 规划 评审 领域 命名 实体 识别 方法 | ||
本发明公开了一种面向电力规划评审领域的命名实体识别方法,包括S1:根据样本语料数据集特征,设立多个刻画实体不同性质的实体标签,获得分词后的样本语料;S2:将分词后的样本语料加载到Glove模型以训练词向量,按位置拼接后得到文本序列向量矩阵;S3:利用多尺度卷积网络对文本序列向量矩阵卷积后重组池化,提取出序列中词粒度的词汇信息;S4:将以文本序列向量矩阵为输入的BiLSTM网络中前向LSTM和后向LSTM末尾状态进行拼接,提取出序列中句粒度的词缀信息;S5:利用Cross‑Transformer模块对序列中词粒度的词汇信息和序列中句粒度的词缀信息进行融合,最后通过CRF层完成命名实体识别。本发明在一定程度上提高了电力规划评审领域命名实体识别的效率。
技术领域
本发明涉及电力规划及计算机技术领域,具体涉及一种面向电力规划评审领域的命名实体识别方法。
背景技术
随着现代社会计算机技术的快速发展,加之人工智能技术及软件技术的广泛使用,人工生成电网规划评审成果的模式已不能满足电力企业发展策划部门提升电网规划工作水平、提高电网规划工作效率及确保电网规划工作质量的要求。传统的电网规划方式采用人工制作excel表格的方式进行数据管理,该方法不仅工作效率低下、工作强度大而且安全系数不高、不易保存,容易造成电网数据被泄露,给企业带来不可估量的损失。为进一步提高电力公司发展策划集约化管理水平、提升项目评审质量、有效发挥各类电网投资所产生的效益,实现电网规划项目评审管理,研究一个基于人工智能的规划评审辅助工具势在必行。
而知识抽取任务中的命名实体识别(Named Entity Recognition,NER)是知识图谱构建的第一步,其中的关键问题是如何从异构数据源中自动抽取信息得到候选知识单元。命名实体识别是一种自动化地从半结构化和无结构数据中抽取实体、关系以及实体属性等结构化信息的技术,如何从非结构化的文本数据中正确的抽取专业术语等名词信息是一个重要问题。
当前电网规划领域命名实体的自动化识别并不理想,大部分情况下仍然需要依靠人工手段进行信息抽取,尤其当文本语料完全是非结构化文本时,现有的抽取方法不再适用,这就导致目前工作人员无法在非结构化电网规划文本语料中进行有效的命名实体识别工作。研究面向中文电力规划评审项目的命名实体识别技术,是电力规划评审管理的重要一环,也是构建电力规划知识图谱的关键任务之一。
发明内容
本发明所要解决的技术问题是当前电网规划领域命名实体的自动化识别并不理想,大部分情况下仍然需要依靠人工手段进行实体抽取,尤其当文本语料完全是非结构化文本时,现有的抽取方法不再适用,导致目前工作人员无法在非结构化电网规划文本语料中进行有效的命名实体识别工作。目的在于提供一种面向电力规划评审领域的命名实体识别方法,解决上述的问题。
本发明通过下述技术方案实现:
一种面向电力规划评审领域的命名实体识别方法,包括以下步骤:
步骤S1:根据样本语料数据集特征,设立多个刻画实体不同性质的实体标签,获得分词后的样本语料;
步骤S2:将分词后的样本语料加载到Glove模型以训练词向量,按位置拼接后得到文本序列向量矩阵
步骤S3:利用多尺度卷积网络对文本序列向量矩阵卷积后重组池化,提取出序列中词粒度的词汇信息;
步骤S4:将以文本序列向量矩阵为输入的BiLSTM网络中前向LSTM和后向LSTM末尾状态进行拼接,提取出序列中句粒度的词缀信息;
步骤S5:利用Cross-Transformer模块对序列中词粒度的词汇信息和序列中句粒度的词缀信息进行融合,最后通过CRF层完成命名实体识别。
进一步地,步骤S1中,所述实体标签包括“项目名”、“公司单位”、“费用名”、“项目类别”、“时间”、“数值”、“设备名”、“地名”、“通信网层次”、“站点名”、“用途”、“线路名”。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网四川省电力公司经济技术研究院,未经国网四川省电力公司经济技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111485849.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种供电电路和回路电阻测试仪
- 下一篇:基于升压拓扑结构的冰箱恒功率化霜电路





