[发明专利]一种电力设备名称识别方法在审
申请号: | 201811535713.2 | 申请日: | 2018-12-14 |
公开(公告)号: | CN109800416A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 宫秀军;周虎 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/903;G06Q50/06 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 刘子文 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种电力设备名称识别方法,包括以下步骤:(1)构建电网专业词库用于存储词汇;包括直接添加单个词汇、直接添加两个以上词汇、筛选添加词汇;(2)实现分词,将专业词库生成为三叉搜索树,利用数字搜索树和二叉搜索树结合实现快速分词;得到字符串数组或字符串列表;(3)将待识别设备名称和标准设备名称按照步骤(2)分成字符串数组或字符串列表,并提取其中可能符合所属地、电压等级的特征词;(4)根据特征词筛选标准设备名称数据库;将待识别设备名称和标准设备名称分词后得到的两个字符串数组进行相似度计算,得到一个0‑1之间的相似度值,通过设定阈值判断符合条件的字符串,选取相应的数据条目;实现设备相识度识别。 | ||
搜索关键词: | 字符串数组 标准设备 分词 词汇 电力设备 名称识别 识别设备 直接添加 专业词库 特征词 串列 筛选 二叉搜索树 名称数据库 数字搜索树 相似度计算 存储词汇 符合条件 数据条目 阈值判断 搜索树 相似度 字符串 构建 电网 | ||
【主权项】:
1.一种电力设备名称识别方法,其特征在于,包括以下步骤:(1)构建电网专业词库用于存储词汇;包括直接添加单个词汇、直接添加两个以上词汇、筛选添加词汇;(2)实现分词,将专业词库生成为三叉搜索树,利用数字搜索树和二叉搜索树结合实现快速分词;得到字符串数组或字符串列表;(3)将待识别设备名称和标准设备名称按照步骤(2)分成字符串数组或字符串列表,并提取其中可能符合所属地、电压等级的特征词;(4)根据特征词筛选标准设备名称数据库;过滤数据以缩短计算时间;将待识别设备名称和标准设备名称分词后得到的两个字符串数组进行相似度计算,得到一个0‑1之间的相似度值,通过设定阈值判断符合条件的字符串,选取相应的数据条目;实现设备相识度识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811535713.2/,转载请声明来源钻瓜专利网。