[发明专利]基于情感分析的话术智能提取方法在审

专利信息
申请号: 201910519174.1 申请日: 2019-06-14
公开(公告)号: CN112086092A 公开(公告)日: 2020-12-15
发明(设计)人: 林正春;肖政宏;姜允志;陈炳标 申请(专利权)人: 广东技术师范大学;广东万丈金数信息技术股份有限公司
主分类号: G10L15/26 分类号: G10L15/26;G10L25/48
代理公司: 暂无信息 代理人: 暂无信息
地址: 510000 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 情感 分析 的话 智能 提取 方法
【说明书】:

发明公开了基于情感分析的话术智能提取方法,通过采集客服日常工作中与客户对话的录音,建立情感映射语料库,文字过滤库,对录音进行语音识别,将音频转化成文字,根据文字过滤库,对文字进行预处理,去除一些无益于话术提取的词、句子和段落等,对预处理后的文字进行分句,分词,能够实现计算机自动快速提取音频文件中的话术,以供客服人员使用。

技术领域

本发明涉及话术提取领域,具体涉及基于情感分析的话术智能提取方法。

背景技术

客服系统随着电子商务的发展愈趋普及。客户可以通过客服系统询问感兴趣的相关信息,办理朴务等等。例如,用户可通过客服系统了解与商品相关的信息,咨询业务。客服系统在使用过程中会存储用户询问的用户问句以及相应的坐席答案,这些内容作为质检数据保存以便后续检查,以保证客户满意度。现有技术基本都是通过人工抽检的方式进行操作。

目前,话术资料的获取,主要依靠人工归纳整理。需要消耗大量的人力物力,且效果欠佳。

发明内容

本发明的目的是为解决上述不足,提供基于情感分析的话术智能提取方法。

本发明的目的是通过以下技术方案实现的:

基于情感分析的话术智能提取方法,具体步骤如下:

(1)采集客服日常工作中与客户对话的录音;

(2)建立情感映射语料库,文字过滤库;

(3)对录音进行语音识别,将音频转化成文字;

(4)根据文字过滤库,对文字进行预处理,去除一些无益于话术提取的词、句子和段落等;

(5)对预处理后的文字进行分句,分词,设对句子进行分词后,得到句子向量sk={wk1,wk2,…,wkm}。其中,sk表示第k个句子对应的向量,wki表示该句子中的词的词向量,i=1,2,…,m,

m表示该句子中词的个数,k=1,2,…,n,n表示句子的个数;

(6)计算sk为正向情感的概率:

其中,f(·)为词在语料库中被判为的正向情感的频率,

(7)计算某个段落para=s1,s2,…,sk,…,st的话术概率P(para)=λ(para)·P(sk),其中,λ(para)=P(sk)*G(k,σ),

(8)根据人工设定的阈值t0,当P(para)>t0时,撮取para及其对应的前后2段为存入数据库,作为话术。

采集客服日常工作中与客户对话的录音中采用在线录音方式进行对话录音。

对录音进行语音识别,将音频转化成文字中采用语音转化软件进行转换。

根据文字过滤库,对文字进行预处理中采用智能文字过滤技术,自动过滤文字,提高效率。

本发明具有如下有益的效果:

本发明通过采集客服日常工作中与客户对话的录音,建立情感映射语料库,文字过滤库,对录音进行语音识别,将音频转化成文字,能够实现计算机自动快速提取音频文件中的话术,以供客服人员使用。

具体实施方式

下面对本发明作进一步的说明:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东技术师范大学;广东万丈金数信息技术股份有限公司,未经广东技术师范大学;广东万丈金数信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910519174.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top