[发明专利]报文处理方法、装置、计算机设备和存储介质在审
申请号: | 202210747023.3 | 申请日: | 2022-06-29 |
公开(公告)号: | CN115098635A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 胡思远;修磊;方浣尘;于圣文 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06N3/04;G06N3/08;H04L9/40 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 景怀宇 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 报文 处理 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种报文处理方法、装置、计算机设备和存储介质,涉及人工智能领域。所述方法包括:获取包括目标关键词的目标报文,目标关键词为黑名单中的任一关键词,对目标报文进行命中状态识别,得到目标报文针对目标关键词的命中状态,命中状态包括第一命中状态或者第二命中状态,第一命中状态用于表征命中目标关键词,第二命中状态用于表征误命中目标关键词,并根据目标报文针对目标关键词的命中状态,确定针对目标报文的处理方式。采用本方法能够有效降低目标筛查的误中率,提高报文处理效率。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种报文处理方法、装置、计算机设备和存储介质。
背景技术
目前大部分金融机构均搭建了名单筛查系统,以通过名单筛查系统对各业务报文进行筛查,及时发现异常报文并对异常报文进行相应处理,以保证数据安全。
传统技术中,金融机构会建立黑名单,名单筛查系统根据黑名单对业务报文进行筛查,当业务报文命中黑名单中任一关键词时则触发报警,系统会对命中任一关键词的业务报文进行拦截,并将其发送给相应工作人员进行后续处理。
然而,对于银行而言,面对复杂的名单筛查机制、不断更新的名单库、数以万计的年均筛查量与报警量、业务的持续变化以及调优的局限性,名单筛查系统的误命中率过高,名单筛查系统的准确性较低,进而造成工作人员的工作量较大,报文处理效率低下。
发明内容
基于此,有必要针对上述技术问题,提供一种能够降低误中率的报文处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种报文处理方法。所述方法包括:
获取包括目标关键词的目标报文,所述目标关键词为黑名单中的任一关键词;
对所述目标报文进行命中状态识别,得到所述目标报文针对所述目标关键词的命中状态,所述命中状态包括第一命中状态或者第二命中状态,所述第一命中状态用于表征命中所述目标关键词,所述第二命中状态用于表征误命中所述目标关键词;
根据所述目标报文针对所述目标关键词的所述命中状态,确定针对所述目标报文的处理方式。
所述对所述目标报文进行命中状态识别,得到所述目标报文针对所述目标关键词的命中状态,包括:
根据所述目标报文与匹配报文的相似度,从所述匹配报文中确定所述目标报文对应的相似报文,所述匹配报文为报文库中包括所述目标关键词的报文,所述报文库用于存储历史报文,所述历史报文中包括所述黑名单中的任一所述关键词,所述历史报文具有针对所述关键词的命中状态;
将所述相似报文针对所述目标关键词的命中状态,作为所述目标报文针对所述目标关键词的命中状态。
在其中一个实施例中,根据所述目标报文与匹配报文的相似度,从所述匹配报文中确定所述目标报文对应的相似报文之前,所述方法还包括:
对所述目标报文进行词嵌入处理,得到所述目标关键词在所述目标报文中对应的第一词向量;
从所述报文库中获取所述目标报文的匹配报文;
根据所述第一词向量和第二词向量,确定所述目标报文与所述匹配报文的相似度,所述第二词向量为所述目标关键词在各所述匹配报文中对应的词向量。
在其中一个实施例中,所述对所述目标报文进行命中状态识别,得到所述目标报文针对所述目标关键词的命中状态通过识别模型实现,所述方法还包括:
根据所述历史报文和所述历史报文针对关键词的标注命中状态,构建所述报文库;
通过所述报文库训练初始识别模型,得到所述识别模型。
在其中一个实施例中,所述通过所述报文库训练初始识别模型,得到所述识别模型,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210747023.3/2.html,转载请声明来源钻瓜专利网。