[发明专利]电力客服客户诉求智能识别方法在审

专利信息
申请号: 201811275648.4 申请日: 2018-10-30
公开(公告)号: CN109558486A 公开(公告)日: 2019-04-02
发明(设计)人: 朱龙珠;盛妍;宫立华;徐宏;陈高月;丁毛毛 申请(专利权)人: 国家电网有限公司客户服务中心
主分类号: G06F16/35 分类号: G06F16/35;G06F16/332
代理公司: 天津佳盟知识产权代理有限公司 12002 代理人: 李益书
地址: 300000 天*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 客户 电力客服 故障报修 智能识别 文本预处理 层次分类 层次分析 分类流程 输出识别 数据分布 减小 算法 小类 分类
【说明书】:

发明涉及电力客服客户诉求智能识别方法。利用层次分析模型,组合使用多种算法,提高识别效率。包括如下过程:文本预处理;判断客户诉求是否属于“故障报修”类别;步骤3:判断客户诉求属于“非故障报修”类别下哪个小类;输出识别结果。本法相对于现有技术的优点在于:采用层次分类策略,针对客户诉求数据分布过于集中的特点,对不同诉求采用不同的分类流程,优先识别比重较大以及体系中的一级诉求,从而减小对后续分类的影响。

技术领域:

本发明涉及电力客服的人工智能技术领域,进一步涉及电力客服客户诉求智能识别方法。

背景技术:

文本分类问题是根据文本的特征将其分到预先设定好的类别中,类别可以是两类,也可以是更多的类别。文本分类是机器学习领域里监督学习的一种重要应用问题,与机器学习领域的分类问题并没有本质的区别,其方法可以归结为利用待分类数据的特征与类别进行匹配,选择最优的匹配结果作为分类结果。文本分类基本流程如图1所示。包括:

(1)文本预处理

文本预处理过程是在文本中提取关键词表示文本的过程,中文文本处理中主要包括文本分词和去停用词两个阶段。之所以进行分词,是因为很多研究表明特征粒度为词粒度远好于字粒度,其实很好理解,因为大部分分类算法不考虑词序信息,基于字粒度显然损失了过多“n-gram”信息。具体到中文分词,不同于英文有天然的空格间隔,需要设计复杂的分词算法。传统算法主要有基于字符串匹配的正向/逆向/双向最大匹配;基于理解的句法和语义分析消歧;基于统计的互信息/CRF方法。近年来随着深度学习的应用,WordEmbedding+Bi-LSTM+CRF方法逐渐成为主流,本文重点在文本分类,就不展开了。而停止词是文本中一些高频的代词连词介词等对文本分类无意义的词,通常维护一个停用词表,特征提取过程中删除停用表中出现的词,本质上属于特征选择的一部分。

(2)特征提取

向量空间模型的文本表示方法的特征提取对应特征项的选择和特征权重计算两部分。特征选择的基本思路是根据某个评价指标独立的对原始特征项(词项)进行评分排序,从中选择得分最高的一些特征项,过滤掉其余的特征项。常用的评价有文档频率、互信息、信息增益、χ2统计量等。特征权重主要是经典的TF-IDF方法及其扩展方法,主要思路是一个词的重要度与在类别内的词频成正比,与所有类别出现的次数成反比。

(3)文本表示

文本表示的目的是把文本预处理后的转换成计算机可理解的方式,是决定文本分类质量最重要的部分。传统做法常用词袋模型(BOW,Bag Of Words)或向量空间模型(Vector Space Model),最大的不足是忽略文本上下文关系,每个词之间彼此独立,并且无法表征语义信息。一般来说词库量至少都是百万级别,因此词袋模型有个两个最大的问题:高纬度、高稀疏性。词袋模型是向量空间模型的基础,因此向量空间模型通过特征项选择降低维度,通过特征权重计算增加稠密性。传统做法在文本表示方面除了向量空间模型,还有基于语义的文本表示方法,比如LDA主题模型、LSI/PLSI概率潜在语义索引等方法,一般认为这些方法得到的文本表示可以认为文档的深层表示,而word embedding文本分布式表示方法则是深度学习方法的重要基础。

(4)文本分类

分类器基本都是统计分类方法了,基本上大部分机器学习方法都在文本分类领域有所应用,比如朴素贝叶斯分类算法(Naive Bayes)、KNN、SVM、最大熵和神经网络等等。

目前呼叫行业使用文本分类技术较少,而且对客户诉求的研究存在几方面的局限:一是受自动化水平限制,研究多集中于投诉诉求,未对全量的客户诉求进行分析,同时多为非实时分析,时效性较差,不能及时捕捉到客户当前的迫切诉求,无法对当前的客户服务工作提供指导;二是受限于语义分析技术,研究数据多为工单,工单数据是由客服人员根据用户来电内容,基于模板填写的,一方面受客服人员主观影响极大,另一方面存在大量信息遗漏,无法深入挖掘服务过程中存在的问题与不足。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司客户服务中心,未经国家电网有限公司客户服务中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811275648.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top