[发明专利]一种电力营销服务热点95598工单自动分类方法在审
申请号: | 201610091704.3 | 申请日: | 2016-02-18 |
公开(公告)号: | CN105760493A | 公开(公告)日: | 2016-07-13 |
发明(设计)人: | 何维民;邹云峰;程雅梦;赵洪莹;杨红;王丽渊 | 申请(专利权)人: | 国网江苏省电力公司电力科学研究院;国家电网公司;上海希尔企业管理咨询股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 211103 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电力 营销 服务 热点 95598 自动 分类 方法 | ||
技术领域
本发明涉及一种电力营销服务热点95598工单自动分类方法,具体涉及一种基于TF-IDF算法的电力营销服务热点95598工单自动分类方法,属于信息收集、信息过滤、信息分类等技术领域。
背景技术
随着计算机技术的应用普及,大量的文字信息开始以计算机可读写的形式存在,由此计算机自动文本分类技术应运而生。当前常用的文本分类方法主要有:决策树分类法、基于支持向量机方法(SVM法)、朴素的贝叶斯分类法、K-最近邻法(KNN)、神经网络法、模糊分类法、Rocchio分类方法和Boosting算法等。文本分类技术被广泛利用在文档索引建立、不良信息检测、主题识别、自动文摘、智能信息检索等各个研究领域。
其中将文本信息转化为可计算的数值信息的方法是向量空间模型,效果最好的为支持向量机方法,建立特征向量的最常用方法是TF-IDF(TF:TermFrequency,IDF:InverseDocumentFrequency)方法,以及在其基础进行的各种改进计算方法。但TF-IDF算法以及不少改进后的TF-IDF算法,常将各个词语分量视为静态的特征项,忽略了部分短文本信息以及特征项增减变动对分类准确性的影响,无法满足对电力营销服务热点95598工单的分类要求。
发明内容
为了解决上述技术问题,本发明提供了一种电力营销服务热点95598工单自动分类方法。
为了达到上述目的,本发明所采用的技术方案是:
一种电力营销服务热点95598工单自动分类方法,包括以下步骤,
步骤一,从国网业务支持系统中获取95598工单受理内容;
步骤二,利用人工智能语义分析技术,对95598工单受理内容进行分词,结合电力营销服务热点的特点,形成电力营销专业词库和同义词库;
步骤三,采用增量-归一化TF-IDF模型对分词结果进行文本表示;
t时刻文本k中某词汇x的TF-IDF值为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力公司电力科学研究院;国家电网公司;上海希尔企业管理咨询股份有限公司,未经国网江苏省电力公司电力科学研究院;国家电网公司;上海希尔企业管理咨询股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610091704.3/2.html,转载请声明来源钻瓜专利网。