[发明专利]电力营销系统中的工单分类方法、装置及其相关设备有效
申请号: | 201811269146.0 | 申请日: | 2018-10-29 |
公开(公告)号: | CN109063217B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 陈书弘;潘炜;吴重民;邓利民;吕浩晖;陈广开;邓明斌;黄文科;陈臣;谭致远;胡文;史琳 | 申请(专利权)人: | 广东电网有限责任公司广州供电局 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06Q50/06 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 刘艳丽 |
地址: | 510620 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电力 营销 系统 中的 分类 方法 装置 及其 相关 设备 | ||
1.一种电力营销系统中的工单分类方法,所述方法包括:
对已分类的工单数据中的字段进行分词,构建工单词频的训练模型,以得到在所述工单中出现的词频最高的词语;
将所述词频最高的词语与所述工单对应的类别进行关联;
接收未分类的工单数据时,对所述未分类的工单数据中的字段进行分词;
将分词所得的词语输入至所述工单词频的训练模型,以得到在所述未分类的工单中出现的词频最高的词语;
将与所述未分类的工单中词频最高的词语相关联的类别确定为所述未分类工单的类别;
其中,所述构建工单词频的训练模型的步骤包括:
对已分类的工单数据中的字段进行分词;
将分词后的词语构成二项集,统计所述二项集中各词语的词频;
将词频最高的词语确定为与所述工单的类别相关联的词语。
2.根据权利要求1所述的方法,其特征在于,所述将词频最高的词语确定为与所述工单的类别相关联的词语的步骤包括:
将统计的所述词频确定为对应词语的权重;
根据相同类别的不同工单中同一词语的权重,计算所述同一词语的平均权重;
将计算的平均权重最大的词语确定为与所述工单的类别相关联的词语。
3.根据权利要求1所述的方法,其特征在于,所述对已分类的工单数据中的字段进行分词的步骤包括:
根据预设的词语映射表,对分词后的所有词语进行筛选,并将筛选后的词语确定为有效分词;
所述将分词后的词语构成二项集的步骤进一步包括:
将筛选后的有效分词构成二项集。
4.根据权利要求3所述的方法,其特征在于,所述对已分类的工单数据中的字段进行分词的步骤包括:
根据所得到的分词的语义构建词语映射表;
将分词后词语出现的词频低于预设词频的词语放入停用词列表;
通过所述词语映射表及所述停用词列表对分词后的所有词语进行筛选。
5.根据权利要求1至3任意一项所述的方法,其特征在于,所述对所述未分类的工单数据中的字段进行分词的步骤包括:
获取所述未分类的工单数据中的人工录入字段;
对获取的所述人工录入字段进行分词。
6.根据权利要求1至3任意一项所述的方法,其特征在于,所述已分类的工单的类别包括电能计量故障工单和/或电量退补流程工单。
7.一种电力营销系统中的工单分类装置,其特征在于,所述装置包括:
模型构建模块,用于对已分类的工单数据中的字段进行分词,构建工单词频的训练模型,以得到在所述工单中出现的词频最高的词语;
关联模块,用于将所述词频最高的词语与所述工单对应的类别进行关联;
分词模块,用于接收未分类的工单数据时,对所述未分类的工单数据中的字段进行分词;
词语输入模块,用于将分词所得的词语输入至所述工单词频的训练模型,以得到在所述未分类的工单中出现的词频最高的词语;
类别确定模块,用于将与所述未分类的工单中词频最高的词语相关联的类别确定为所述未分类工单的类别;
其中,所述模型构建模块还包括:
分词单元,用于对已分类的工单数据中的字段进行分词;
统计单元,用于将分词后的词语构成二项集,统计所述二项集中各词语的词频;
词语确定单元,用于将词频最高的词语确定为与所述工单的类别相关联的词语。
8.根据权利要求7所述的装置,其特征在于,所述词语确定单元具体用于:
将统计的所述词频确定为对应词语的权重;
根据相同类别的不同工单中同一词语的权重,计算所述同一词语的平均权重;
将计算的平均权重最大的词语确定为与所述工单的类别相关联的词语。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司广州供电局,未经广东电网有限责任公司广州供电局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811269146.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分布式垂直业务搜索爬虫框架
- 下一篇:一种统计过程的控制方法和系统