[发明专利]一种基于Ternary Search Trie的电力设备模型特征匹配方法在审
| 申请号: | 201911115893.3 | 申请日: | 2019-11-14 |
| 公开(公告)号: | CN110866397A | 公开(公告)日: | 2020-03-06 |
| 发明(设计)人: | 张鹏;肖林朋;张浩;王守琴;郭子明;穆永铮;戚岳;孙舶皓;刘蒙;耿艳;张旭 | 申请(专利权)人: | 国网冀北电力有限公司;国家电网有限公司;北京科东电力控制系统有限责任公司 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/295;G06F40/30;G06F16/31;G06F16/33;G06K9/62 |
| 代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
| 地址: | 100045 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 ternary search trie 电力设备 模型 特征 匹配 方法 | ||
本发明公开一种基于Ternary Search Trie的电力设备模型特征匹配方法,包括以下步骤:步骤a,使用递归的方法将专业电力设备名称存放在三叉字典查找树中,建立起电力专业词库;步骤b,将电力专业词库中电力语术进行分词操作,统一数字书写;步骤c,基于分词的效果,计算电力设备模型特征语义相似度。本发明提供的一种基于Ternary Search Trie的电力设备模型特征匹配方法,选用三叉查询字典树,具备存储高效,查询快速优点;对设备名称进行数字书写统一,具有电力设备命名实体识别功能;考虑词序以及阿拉伯数字和特殊字符之间的相似性,适用于针对非常规设备编号的相似度计算问题。
技术领域
本发明涉及一种基于Ternary Search Trie的电力设备模型特征匹配方法,属于电力系统调度自动化技术领域。
背景技术
随着智能电网科技的快速发展以及信息化的大数据时代到来,针对电网专业的名称识别,使用基于数据和算法的识别服务将逐步代替人工识别工作。这种使用原始数据,针对电网行业的算法是保障数据应用质量,是电网数据发挥价值的关键一步。由于缺乏对电网设备命名标准的统一规范管理,调度系统应用更是各应用自身拥有和维护一套甚至多套台账信息,这些问题都导致了涉及的设备台账信息命名出现了大量不一致的情况,降低了应用的兼容性和拓展性,由此,解析设备名称中的语义信息,并识别出本质为同一设备的不同命名成为提升电力、互联网交互行业的工作效率的主要难点。
在现有工作中对于设备名称相似度匹配已经投入一些研究,主要是基于文本比较的编辑距离计算,利用LD相似度算法和jarccard相似度算法匹配配置数据库制定列中数据的相似度,对大于设定阈值的条目输出对照表,识别常见命名不匹配情况。单纯的比较编辑距离算法,由于是将设备名称作为两个给定的文本,造成依赖字符串的分词顺序,对于记录缺失或者不规范的设备名缺乏识别能力,对于专业电网业务场景面临的专业词库和单纯的中文或英文命名没有很好的解决。
发明内容
本发明要解决的技术问题是,克服现有技术的缺陷,提供一种具备存储高效,查询快速优点,具有电力设备命名实体识别功能,适用于针对非常规设备编号的相似度计算问题的基于Ternary Search Trie的电力设备模型特征匹配方法。
为解决上述技术问题,本发明采用的技术方案为:
一种基于Ternary Search Trie的电力设备模型特征匹配方法,包括以下步骤:
步骤a,使用递归的方法将专业电力设备名称存放在三叉字典查找树中,建立起电力专业词库;
步骤b,将电力专业词库中电力语术进行分词操作,统一数字书写;
步骤c,基于分词的效果,计算电力设备模型特征语义相似度。
步骤a包括以下具体步骤:
步骤a1,将数据库中的词汇进行清洗和去重后按照Unicode编码顺序排序存在数组中;
步骤a2,如果数组长度大于一则输出数据组中点的值写入新数组;
步骤a3,将输入的词汇拆分为单个字符,分别对左子树和右子树进行单字符的插入;
步骤a4,如果数组长度大于1,那么左边数组递归调用函数,如果数组长度大于1,那么右边数组递归调用函数;
步骤a5,返回插入数据后的树结构。
步骤b包括以下具体步骤:
步骤b1,计算输入字符串的字符长度;
步骤b2,记录匹配起始位置;
步骤b3,进入循环并记录起始位置小于字符串长度的值;
步骤b4,在循环中记录正向最大长度单词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网冀北电力有限公司;国家电网有限公司;北京科东电力控制系统有限责任公司,未经国网冀北电力有限公司;国家电网有限公司;北京科东电力控制系统有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911115893.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:塑料产品生产系统
- 下一篇:码缘锯齿防伪方法及产品





