[发明专利]一种电力设备名称识别方法在审
申请号: | 201811535713.2 | 申请日: | 2018-12-14 |
公开(公告)号: | CN109800416A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 宫秀军;周虎 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/903;G06Q50/06 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 刘子文 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符串数组 标准设备 分词 词汇 电力设备 名称识别 识别设备 直接添加 专业词库 特征词 串列 筛选 二叉搜索树 名称数据库 数字搜索树 相似度计算 存储词汇 符合条件 数据条目 阈值判断 搜索树 相似度 字符串 构建 电网 | ||
1.一种电力设备名称识别方法,其特征在于,包括以下步骤:
(1)构建电网专业词库用于存储词汇;包括直接添加单个词汇、直接添加两个以上词汇、筛选添加词汇;
(2)实现分词,将专业词库生成为三叉搜索树,利用数字搜索树和二叉搜索树结合实现快速分词;得到字符串数组或字符串列表;
(3)将待识别设备名称和标准设备名称按照步骤(2)分成字符串数组或字符串列表,并提取其中可能符合所属地、电压等级的特征词;
(4)根据特征词筛选标准设备名称数据库;过滤数据以缩短计算时间;将待识别设备名称和标准设备名称分词后得到的两个字符串数组进行相似度计算,得到一个0-1之间的相似度值,通过设定阈值判断符合条件的字符串,选取相应的数据条目;实现设备相识度识别。
2.根据权利要求1所述一种电力设备名称识别方法,其特征在于,步骤(1)中直接添加单个词汇是用于专有词汇的添加;直接添加两个以上词汇是将电力设备中的某一关键属性栏直接添加进词库当中;筛选添加词汇用于直接将设备的名称进行现有的词库分词后,将目前不存在于词库中的词汇添加进词库当中。
3.根据权利要求1所述一种电力设备名称识别方法,其特征在于,分词操作是使用最长字符串匹配法,将所给的字符串根据词库中记载的词汇或同义词完全分割开来,并选择去除其中的无匹配字符子串或将无匹配字符子串保留在词库中;分词后将会得到一组字符串数组或者字符串列表用于之后的相似度计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811535713.2/1.html,转载请声明来源钻瓜专利网。