[发明专利]一种诈骗电话语音自动标注系统及方法在审

专利信息
申请号: 201811304612.4 申请日: 2018-11-04
公开(公告)号: CN109493882A 公开(公告)日: 2019-03-19
发明(设计)人: 张震;李鹏;黄远;高圣翔;杜裕琴;倪江帆 申请(专利权)人: 国家计算机网络与信息安全管理中心;讯飞智元信息科技有限公司
主分类号: G10L25/51 分类号: G10L25/51;G10L17/00;G10L15/26;H04M3/22
代理公司: 暂无信息 代理人: 暂无信息
地址: 100020*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 标注 维度 连续语音 诈骗电话 自动标注 声纹 智能语音 语音 标签 通话语音数据 电话诈骗 技术实现 加密传输 目标数据 输入语音 语音数据 自动处理 自动分析 输出端 输入端 有效地 场景 应用 优化 保证 管理
【说明书】:

发明公开一种诈骗电话语音自动标注系统,包括基础维度标注模块、声纹标注模块、连续语音识别标注模块,所述基础维度标注模块的输出端分别与所述声纹标注模块的输入端、所述连续语音识别标注模块的输入端相连接。本发明还提出一种诈骗电话语音自动标注方法,具体包括如下步骤:基础维度标注步骤;连续语音识别步骤;声纹标注步骤。本发明通过智能语音技术实现对输入语音数据进行自动处理,实现语音数据的自动分析识别,并进行标签预标注工作,再结合人工确认,进行目标数据维度标签的有效标注管理,有效地利用通话语音数据,优化智能语音技术在电话诈骗场景下的应用及效果,同时保证数据在标注过程中的脱密及加密传输。

技术领域

本发明涉及一种诈骗电话语音自动标注系统及方法,属于诈骗预警技术领域。

背景技术

电话诈骗作为非接触式犯罪,具备高度灵活性、变化性、对抗性,单靠单一固定的技术思路难以应对复杂的诈骗手法的形式变化,所以对抗电信诈骗活动亟需利用人工智能技术突破现有瓶颈,深度挖掘各种类型诈骗模式,形成诈骗模式的快速发现预警能力,实现对诈骗形式的全面发现,支撑诈骗电话管控模式升级,提升诈骗电话管控能力。

目前国内电信诈骗预警防范主要有基于信令数据、基于录音模板匹配的诈骗电话预警和基于智能语音技术的自然人诈骗电话预警等技术路线。

其中基于信令数据预警技术主要依赖通话数据的话单信息,通过对话单数据的分析,进行通话行为异常通话的预警输出。基于录音模板匹配的诈骗电话预警和基于智能语音技术的自然人诈骗电话预警主要基于通话语音数据,通过对通话语音数据的分析处理,实现合成音有害电话以及自然人有害电话的快速预警发现。分析当前诈骗电话的通话行为特征,结合现有诈骗电话预警识别技术,为了有效的提升电信网络中诈骗电话的预警能力,需提供足量的实际诈骗电话数据,通过对这些数据的标注,为智能语音技术提供训练模型所需的多维度属性标签。

但是,当前还没有规范化的数据标注体系用以指导标注工作,例如,存在标签维度不明确、覆盖不全,无敏感脱密加密手段、自动化标注程度低、标注结果缺乏有效核验方式等问题。因此,针对这些问题,亟需一套规范化的数据标注方法来指导数据标注工作,从而有效提升此类业务相关技术的模型训练和迭代优化能力,助力打击电信诈骗业务的更好发展。

发明内容

为了有效地利用通话语音数据,优化智能语音技术在电话诈骗场景下的应用及效果,同时保证数据在标注过程中的脱密及加密传输,本发明提出一种诈骗电话语音自动标注系统及方法,主要研究语音语料的精细化标注,同时研究语料的自动标注技术,最终通过标注系统的搭建,实现数据标签维度的标注和数据管理工作。

为解决上述技术问题,本发明提供一种诈骗电话语音自动标注系统,其特征在于,包括基础维度标注模块、声纹标注模块、连续语音识别标注模块,所述基础维度标注模块的输出端分别与所述声纹标注模块的输入端、所述连续语音识别标注模块的输入端相连接。

作为一种较佳的实施例,所述基础维度标注模块包括基础维度语音预处理模块、语种识别模块、基础维度假音识别模块、男女声识别模块,所述基础维度语音预处理模块与所述语种识别模块相连接,所述语种识别模块与所述基础维度假音识别模块相连接,所述基础维度假音识别模块与所述男女声识别模块相连接。

作为一种较佳的实施例,所述基础维度语音预处理模块用于将针对自然语音识别分析、诈骗文本发现和语音内容深度分析的应用需求,提供电话信道语音数据中的话音活动检测、彩铃检测、无效音检测和有效语音检测功能;所述语种识别模块用于通过提取通话语音的核心特征,并进行模型比对以及得分判决,以提供通话语音的语种识别服务;所述基础维度假音识别模块用于对合成音模板数据进行快速精准识别;所述男女声识别模块用于根据对诈骗电话特征的分析,同步使用男女声识别技术,根据男声和女声由于生理发音器官的不同而引起的频谱差异,来对语音发声者进行性别判断。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;讯飞智元信息科技有限公司,未经国家计算机网络与信息安全管理中心;讯飞智元信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811304612.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top