[发明专利]用于智能语音外呼系统的语料处理方法以及系统在审
| 申请号: | 201911138353.7 | 申请日: | 2019-11-18 |
| 公开(公告)号: | CN111083292A | 公开(公告)日: | 2020-04-28 |
| 发明(设计)人: | 崔晶晶;张政;经宇 | 申请(专利权)人: | 集奥聚合(北京)人工智能科技有限公司 |
| 主分类号: | H04M3/42 | 分类号: | H04M3/42;H04M3/22;G10L15/26;G10L13/04;G10L25/51;H04L29/06;H04L29/08 |
| 代理公司: | 北京瑞盛铭杰知识产权代理事务所(普通合伙) 11617 | 代理人: | 李绩 |
| 地址: | 100024 北京市朝*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 智能 语音 系统 语料 处理 方法 以及 | ||
本申请公开了一种用于智能语音外呼系统的语料处理方法以及系统。该方法包括确定第一语料和第二语料中的敏感信息;导入所述第一语料和所述第二语料,并标识出所述敏感信息;当接入用户电话进行通话时,记录通话过程中的语音和文本信息;根据所述语音和文本信息,导出不含有敏感信息的所述第一语料和所述第二语料。本申请解决了智能语音外呼系统无法较好地为用户隐私安全提供保障的技术问题。通过本申请对智能语音外呼系统中的文本、语音材料自动脱敏。
技术领域
本申请涉及人工智能领域,具体而言,涉及一种用于智能语音外呼系统的语料处理方法以及系统。
背景技术
传统电销行业中通常需要考虑数据泄露以及用户个人隐私泄露的风险因素。
缺点在于:用户其他个人信息都是用户个人隐私范畴,在智能语音外呼系统中需要为用户隐私安全提供保障。
针对相关技术中智能语音外呼系统无法较好地为用户隐私安全提供保障的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种用于智能语音外呼系统的语料处理方法以及系统,以解决智能语音外呼系统无法较好地为用户隐私安全提供保障的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种用于智能语音外呼系统的语料处理方法,用于处理第一语料和第二语料通过所述智能语音外呼系统上传和下载过程中的敏感信息,所述第一语料是指文本语料,第二语料是指语音语料。
根据本申请的用于智能语音外呼系统的语料处理方法包括:确定第一语料和第二语料中的敏感信息;导入所述第一语料和所述第二语料,并标识出所述敏感信息;当接入用户电话进行通话时,记录通话过程中的语音和文本信息;根据所述语音和文本信息,导出不含有敏感信息的所述第一语料和所述第二语料。
进一步地,确定第一语料和第二语料中的敏感信息包括:
整理第一语料的对话任务的文本材料,将所述敏感信息设置为变量。
进一步地,确定第一语料和第二语料中的敏感信息包括:
整理第二语料的对话任务的语音材料,将所述敏感信息设置为变量。
进一步地,导入所述第一语料和所述第二语料,并标识出所述敏感信息包括:
导入固定文本信息和语音信息并标示所述变量的位置。
进一步地,导入所述第一语料和所述第二语料,并标识出所述敏感信息之后,还包括:
添加相应变量和话术节点、添加特殊常见问答或创建常见问答模板、添加通用对话模板、添加分支意图模板、添加意图关键字或者本地上传非敏感内容录音。
进一步地,根据所述语音和文本信息,导出不含有敏感信息的所述第一语料和所述第二语料包括:
将所述第一语料中的文本变量真实值替换为变量字段。
进一步地,根据所述语音和文本信息,导出不含有敏感信息的所述第一语料和所述第二语料包括:
将所述第二语料中的通话录音变量真实值替换成空白录音。
进一步地,当接入用户电话进行通话时,记录通话过程中的语音和文本信息之后,还包括:
将用户通话中的敏感信息进行加密并上传,根据话术模板进行语音交互;
根据所述话术模板调用对应的上传录音与用户进行对话,如果有敏感信息存在,根据敏感信息位置标记,将敏感信息调用文本转化语音接口合成录音后替入补足全句进行语音交互。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于集奥聚合(北京)人工智能科技有限公司,未经集奥聚合(北京)人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911138353.7/2.html,转载请声明来源钻瓜专利网。





