[发明专利]用于智能语音外呼系统的语料处理方法以及系统在审

申请号：	201911138353.7	申请日：	2019-11-18
公开（公告）号：	CN111083292A	公开（公告）日：	2020-04-28
发明（设计）人：	崔晶晶;张政;经宇	申请（专利权）人：	集奥聚合（北京）人工智能科技有限公司
主分类号：	H04M3/42	分类号：	H04M3/42;H04M3/22;G10L15/26;G10L13/04;G10L25/51;H04L29/06;H04L29/08
代理公司：	北京瑞盛铭杰知识产权代理事务所(普通合伙) 11617	代理人：	李绩
地址：	100024 北京市朝***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于智能语音系统语料处理方法以及
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种用于智能语音外呼系统的语料处理方法以及系统。该方法包括确定第一语料和第二语料中的敏感信息；导入所述第一语料和所述第二语料，并标识出所述敏感信息；当接入用户电话进行通话时，记录通话过程中的语音和文本信息；根据所述语音和文本信息，导出不含有敏感信息的所述第一语料和所述第二语料。本申请解决了智能语音外呼系统无法较好地为用户隐私安全提供保障的技术问题。通过本申请对智能语音外呼系统中的文本、语音材料自动脱敏。

技术领域

本申请涉及人工智能领域，具体而言，涉及一种用于智能语音外呼系统的语料处理方法以及系统。

背景技术

传统电销行业中通常需要考虑数据泄露以及用户个人隐私泄露的风险因素。

缺点在于：用户其他个人信息都是用户个人隐私范畴，在智能语音外呼系统中需要为用户隐私安全提供保障。

针对相关技术中智能语音外呼系统无法较好地为用户隐私安全提供保障的问题，目前尚未提出有效的解决方案。

发明内容

本申请的主要目的在于提供一种用于智能语音外呼系统的语料处理方法以及系统，以解决智能语音外呼系统无法较好地为用户隐私安全提供保障的问题。

为了实现上述目的，根据本申请的一个方面，提供了一种用于智能语音外呼系统的语料处理方法，用于处理第一语料和第二语料通过所述智能语音外呼系统上传和下载过程中的敏感信息，所述第一语料是指文本语料，第二语料是指语音语料。

根据本申请的用于智能语音外呼系统的语料处理方法包括：确定第一语料和第二语料中的敏感信息；导入所述第一语料和所述第二语料，并标识出所述敏感信息；当接入用户电话进行通话时，记录通话过程中的语音和文本信息；根据所述语音和文本信息，导出不含有敏感信息的所述第一语料和所述第二语料。

进一步地，确定第一语料和第二语料中的敏感信息包括：

整理第一语料的对话任务的文本材料，将所述敏感信息设置为变量。