[发明专利]基于知识图谱的引导教唆语料的检测方法及其相关设备在审

专利信息
申请号: 202011491853.1 申请日: 2020-12-16
公开(公告)号: CN112528040A 公开(公告)日: 2021-03-19
发明(设计)人: 汪淼 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06F16/36 分类号: G06F16/36;G06F40/295
代理公司: 深圳市世联合知识产权代理有限公司 44385 代理人: 汪琳琳
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 知识 图谱 引导 教唆 语料 检测 方法 及其 相关 设备
【说明书】:

本申请实施例属于大数据领域,应用于智慧政务/教育领域中,涉及一种基于知识图谱的引导教唆语料的检测方法及其相关设备,包括接收标准语料数据集,对标准语料数据集进行特征提取,获得标准语料特征,标准语料数据集中不存在引导教唆信息;基于标准语料特征构建第一知识图谱;接收待检测语料,对待检测语料进行命名实体识别,获得待检测实体,在第一知识图谱中分别对每个待检测实体进行推演;当待检测实体推演失败时,将推演失败的待检测实体作为引导教唆实体,并将引导教唆实体对应的待检测语料作为引导教唆语料,输出引导教唆语料。其中,第一知识图谱可存储于区块链中。本申请能够快速识别出引导教唆语料,从而实现对引导教唆行为的检测。

技术领域

本申请涉及大数据技术领域,尤其涉及基于知识图谱的引导教唆语料的检测方法及其相关设备。

背景技术

随着计算机技术的不断革新和发展,计算机已经应用到各行各业中。在坐席与客户沟通的过程中,常常容易出现引导教唆客户的情况,故而,引导教唆是语音质检中的一个常见违规场景,该违规现象出现频率高,违规性质是较为严重的,是语音质检环节中一个重要的质检点。

传统质检算法多基于正则匹配规则,存在覆盖场景相对单一,泛化能力交叉的局限。同时随着坐席话术的不断优化,新兴科技的不断更新,坐席人员在引导客户方面会更加的具有创新性和时代性,导致语料数据不断的变化。若是采用完全基于规则的算法进行检测,需要耗费巨大的人力采集标注引导教唆的违规话术,以及编写冗长且复杂的规则逻辑,计算机无法随着时间的推移自学习式更新优化。

发明内容

本申请实施例的目的在于提出一种基于知识图谱的引导教唆语料的检测方法及其相关设备,快速确定出待检测语料是否属于引导教唆语料,有效实现对引导教唆行为的检测。

为了解决上述技术问题,本申请实施例提供一种基于知识图谱的引导教唆语料的检测方法,采用了如下所述的技术方案:

一种基于知识图谱的引导教唆语料的检测方法,包括下述步骤:

接收标准语料数据集,对所述标准语料数据集进行特征提取,获得标准语料特征,其中,所述标准语料数据集中不存在引导教唆信息;

基于所述标准语料特征构建第一知识图谱;

接收待检测语料,对所述待检测语料进行命名实体识别,获得待检测实体,并在所述第一知识图谱中分别对每个所述待检测实体进行推演,获得推演结果;

当所述推演结果为推演失败时,将推演失败的待检测实体作为引导教唆实体,并将所述引导教唆实体对应的所述待检测语料作为引导教唆语料,输出所述引导教唆语料;

当所述推演结果为推演成功时,基于推演成功的待检测实体更新所述第一知识图谱,获得第二知识图谱。

进一步的,所述对所述标准语料数据集进行提取,获得标准语料特征的步骤包括:

提取所述标准语料数据集中每条语料的三元组数据,作为所述标准语料特征。

进一步的,所述提取所述标准语料数据集中每条语料的三元组数据,作为所述标准语料特征的步骤包括:

对所述标准语料数据集中的每条语料均进行分词操作,获得标准语料词语;

基于预设的实体识别工具对所述标准语料词语进行命名实体识别,获得命名实体集合;

确定命名实体集合中不同命名实体之间的连接关系,基于所述连接关系生成三元组数据;

基于预设的限定关系对所述三元组数据进行筛选,获得目标三元组数据,将所述目标三元组数据作为所述标准语料特征。

进一步的,当所述推演结果为推演失败时,将推演失败的待检测实体作为引导教唆实体,并将所述引导教唆实体对应的待检测语料作为引导教唆语料,输出所述引导教唆语料的步骤包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011491853.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top