[发明专利]信息处理方法、装置、计算机设备和存储介质在审
申请号: | 202210032655.1 | 申请日: | 2022-01-12 |
公开(公告)号: | CN114333784A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 梁健龙;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/18;G10L17/18 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 付婧 |
地址: | 518048 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 装置 计算机 设备 存储 介质 | ||
本发明涉及一种信息处理方法方法、装置、计算机设备和存储介质,该方法包括:获取待处理的语音内容,语音内容至少包括第一发言人的语音内容;基于语音内容中语音的静音片段,将语音内容划分为多个语音片段;基于语音片段的声纹特征,确定同一发言人对应的语音片段;提取发言人的语音片段中包含的身份关键词和/或禁语关键词;如果语音片段中包含身份关键词,则基于身份关键词确定发言人是否是第一发言人;如果语音片段中包含禁语关键词,则分析禁语关键词的语音片段的语义,得到发言人的发言质量的评估结果。上述方法可以提升了质检的准确率。
技术领域
本发明涉及数据处理技术领域,特别是涉及信息处理方法、装置、计算机设备和存储介质。
背景技术
服务质检是热线服务运营过程中非常重要的一个品质管控环节。传统的服务质检主要依托人工抽检日常座席员的录音进行跟听、分析。对发现的各类问题制定提升计划,实施改善方案,从而进一步完善内部服务质量控制体系,并从数据上客观真实地反映出呼叫中心前台与后台在各环节上的快速响应性与紧密合作性,寻找服务短板,提出改进意见、建议并协助做好业务流程改善,从而不断提升呼叫中心客户服务热线的服务水平。然而,传统的质检采取了人工抽检方式,抽检结果覆盖率较低,人员抽检耗时,时效性较低。
发明内容
本申请提供了一种信息处理方法、装置、计算机设备和存储介质。
第一方面提供了一种信息处理方法,所述方法包括:
获取待处理的语音内容,所述语音内容至少包括第一发言人的语音内容;
基于所述语音内容中语音的静音片段,将所述语音内容划分为多个语音片段;
基于所述语音片段的声纹特征,确定同一发言人对应的语音片段;
提取所述发言人的语音片段中包含的身份关键词和/或禁语关键词;
如果所述语音片段中包含身份关键词,则基于所述身份关键词确定所述发言人是否是所述第一发言人;
如果所述语音片段中包含禁语关键词,则分析禁语关键词的语音片段的语义,得到所述发言人的发言质量的评估结果。
在一些实施例中,所述基于所述语音内容中语音的静音片段,将所述语音内容划分为多个语音片段,包括:
在所述语音内容的静音停顿处作为切割点将所述语音内容划分为多个语音片段,其中,所述静音停顿处满足以下条件之一:静音片段持续第一预设时长、静音片段第二预设时长内有占比大于预设比例的时长是静音且没有超过第三预设时长的连续非静音。
在一些实施例中,所述基于所述语音片段的声纹特征,确定同一发言人对应的语音片段,包括:
对多个语音片段的声纹进行聚类,得到多个聚类结果;
确定每个聚类结果中的多个语音片段对应于同一发言人。
在一些实施例中,所述提取所述发言人的语音片段中包含的身份关键词和/或禁语关键词,包括:
分别将每个聚类结果的语音片段转换为文本数据;
采用自然语言处理方式,提取所述语音片段进行身份关键词和/或禁语关键词。
在一些实施例中,所述分别将每个聚类结果的语音片段转换为文本数据,包括:
将语音片段转写为文本数据,对所述文本数据进行字母大小写转换;
根据历史发言人会话文本数据判断文本转写合理或文本转写错误,所述历史发言人会话文本数据是命中服务禁语的发言人会话内容且命中的禁语关键词是转写错误的。
在一些实施例中,所述根据历史发言人会话文本数据判断文本转写合理或文本转写错误,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210032655.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据核验方法、装置、电子设备及存储介质
- 下一篇:一种流体输送的异常检测系统