[发明专利]基于情感分析的话术智能提取方法在审
申请号: | 201910519174.1 | 申请日: | 2019-06-14 |
公开(公告)号: | CN112086092A | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 林正春;肖政宏;姜允志;陈炳标 | 申请(专利权)人: | 广东技术师范大学;广东万丈金数信息技术股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L25/48 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 情感 分析 的话 智能 提取 方法 | ||
本发明公开了基于情感分析的话术智能提取方法,通过采集客服日常工作中与客户对话的录音,建立情感映射语料库,文字过滤库,对录音进行语音识别,将音频转化成文字,根据文字过滤库,对文字进行预处理,去除一些无益于话术提取的词、句子和段落等,对预处理后的文字进行分句,分词,能够实现计算机自动快速提取音频文件中的话术,以供客服人员使用。
技术领域
本发明涉及话术提取领域,具体涉及基于情感分析的话术智能提取方法。
背景技术
客服系统随着电子商务的发展愈趋普及。客户可以通过客服系统询问感兴趣的相关信息,办理朴务等等。例如,用户可通过客服系统了解与商品相关的信息,咨询业务。客服系统在使用过程中会存储用户询问的用户问句以及相应的坐席答案,这些内容作为质检数据保存以便后续检查,以保证客户满意度。现有技术基本都是通过人工抽检的方式进行操作。
目前,话术资料的获取,主要依靠人工归纳整理。需要消耗大量的人力物力,且效果欠佳。
发明内容
本发明的目的是为解决上述不足,提供基于情感分析的话术智能提取方法。
本发明的目的是通过以下技术方案实现的:
基于情感分析的话术智能提取方法,具体步骤如下:
(1)采集客服日常工作中与客户对话的录音;
(2)建立情感映射语料库,文字过滤库;
(3)对录音进行语音识别,将音频转化成文字;
(4)根据文字过滤库,对文字进行预处理,去除一些无益于话术提取的词、句子和段落等;
(5)对预处理后的文字进行分句,分词,设对句子进行分词后,得到句子向量sk={wk1,wk2,…,wkm}。其中,sk表示第k个句子对应的向量,wki表示该句子中的词的词向量,i=1,2,…,m,
m表示该句子中词的个数,k=1,2,…,n,n表示句子的个数;
(6)计算sk为正向情感的概率:
其中,f(·)为词在语料库中被判为的正向情感的频率,
(7)计算某个段落para=s1,s2,…,sk,…,st的话术概率P(para)=λ(para)·P(sk),其中,λ(para)=P(sk)*G(k,σ),
(8)根据人工设定的阈值t0,当P(para)>t0时,撮取para及其对应的前后2段为存入数据库,作为话术。
采集客服日常工作中与客户对话的录音中采用在线录音方式进行对话录音。
对录音进行语音识别,将音频转化成文字中采用语音转化软件进行转换。
根据文字过滤库,对文字进行预处理中采用智能文字过滤技术,自动过滤文字,提高效率。
本发明具有如下有益的效果:
本发明通过采集客服日常工作中与客户对话的录音,建立情感映射语料库,文字过滤库,对录音进行语音识别,将音频转化成文字,能够实现计算机自动快速提取音频文件中的话术,以供客服人员使用。
具体实施方式
下面对本发明作进一步的说明:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东技术师范大学;广东万丈金数信息技术股份有限公司,未经广东技术师范大学;广东万丈金数信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910519174.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于微博图文信息的客户行为预测方法
- 下一篇:扇头组件和风扇