[发明专利]一种基于Ternary Search Trie的电力设备模型特征匹配方法在审
| 申请号: | 201911115893.3 | 申请日: | 2019-11-14 |
| 公开(公告)号: | CN110866397A | 公开(公告)日: | 2020-03-06 |
| 发明(设计)人: | 张鹏;肖林朋;张浩;王守琴;郭子明;穆永铮;戚岳;孙舶皓;刘蒙;耿艳;张旭 | 申请(专利权)人: | 国网冀北电力有限公司;国家电网有限公司;北京科东电力控制系统有限责任公司 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/295;G06F40/30;G06F16/31;G06F16/33;G06K9/62 |
| 代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
| 地址: | 100045 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 ternary search trie 电力设备 模型 特征 匹配 方法 | ||
1.一种基于Ternary Search Trie的电力设备模型特征匹配方法,其特征在于:包括以下步骤:
步骤a,使用递归的方法将专业电力设备名称存放在三叉字典查找树中,建立起电力专业词库;
步骤b,将电力专业词库中电力语术进行分词操作,统一数字书写;
步骤c,基于分词的效果,计算电力设备模型特征语义相似度。
2.根据权利要求1所述的一种基于Ternary Search Trie的电力设备模型特征匹配方法,其特征在于:步骤a包括以下具体步骤:
步骤a1,将数据库中的词汇进行清洗和去重后按照Unicode编码顺序排序存在数组中;
步骤a2,如果数组长度大于一则输出数据组中点的值写入新数组;
步骤a3,将输入的词汇拆分为单个字符,分别对左子树和右子树进行单字符的插入;
步骤a4,如果数组长度大于1,那么左边数组递归调用函数,如果数组长度大于1,那么右边数组递归调用函数;
步骤a5,返回插入数据后的树结构。
3.根据权利要求1所述的一种基于Ternary Search Trie的电力设备模型特征匹配方法,其特征在于:步骤b包括以下具体步骤:
步骤b1,计算输入字符串的字符长度;
步骤b2,记录匹配起始位置;
步骤b3,进入循环并记录起始位置小于字符串长度的值;
步骤b4,在循环中记录正向最大长度单词;
步骤b5,如若该单词已经与词库中的某个单词匹配,则输入该单词并将指针向下移动,否则按照单个字切分,输出单个字并将指针向下一位;
步骤b6,返回设备名称分词数组。
4.根据权利要求1所述的一种基于Ternary Search Trie的电力设备模型特征匹配方法,其特征在于:步骤c包括以下具体步骤:
步骤c1,将分词后的两个设备特征向量合并,并去除冗余;
步骤c2,将合并处理后的向量进行特殊词的正则化;
步骤c3,按照原始分词设备特征向量中元素在合并处理后向量中对应位置出现的词序构建比较向量;
步骤c4,计算语义相似度Sa;
步骤c5,计算词序相似度Sb;
步骤c6,根据语义相似度Sa和词序相似度Sb计算整体相似度S;
步骤c7,返回设备相似度S。
5.根据权利要求4所述的一种基于Ternary Search Trie的电力设备模型特征匹配方法,其特征在于:步骤c1中,两个电力设备分词向量Тx={ω1,ω2,…,ωn},合并后用向量T表示,其中x=1,2,ωn代表在Tx中词序。
6.根据权利要求5所述的一种基于Ternary Search Trie的电力设备模型特征匹配方法,其特征在于:如果被分词的词元ui出现在TX中,那么Sx={ωi=1},Rx={ωi},否则Sx={ωi=0.2},Rx={ωi=0.4};语义相似度词序相似度
7.根据权利要求6所述的一种基于Ternary Search Trie的电力设备模型特征匹配方法,其特征在于:步骤c6中,整体相似度S的计算方法如下:其中α代表语义相似度比重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网冀北电力有限公司;国家电网有限公司;北京科东电力控制系统有限责任公司,未经国网冀北电力有限公司;国家电网有限公司;北京科东电力控制系统有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911115893.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:塑料产品生产系统
- 下一篇:码缘锯齿防伪方法及产品





