[发明专利]一种风险主体的识别方法、装置、存储介质及设备在审
申请号: | 202210573905.2 | 申请日: | 2022-05-25 |
公开(公告)号: | CN114818716A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 潘东行;桂朔;丁小进;祝黎;王雪萌;陈洁 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06K9/62;G06N3/04;G06N3/08;G06Q40/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 郄晨芳 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 风险 主体 识别 方法 装置 存储 介质 设备 | ||
1.一种风险主体的识别方法,其特征在于,应用于服务器,包括:
在接收到客户端发送的待识别文本时,对所述待识别文本进行处理,得到字序列;
将所述字序列输入到第一识别模型、第二识别模型、第三识别模型中,得到所述第一识别模型输出的第一识别结果、所述第二识别模型输出的第二识别结果、所述第三识别模型输出的第三识别结果;所述第一识别结果、所述第二识别结果、所述第三识别结果均包括各个实体、每个所述实体的类别、每个所述实体在所述待识别文本中的位置;所述第一识别模型基于样本语料作为输入训练得到;所述第二识别模型基于条件随机场以及预训练模型得到;所述第三识别模型基于双向门控循环单元、所述条件随机场以及所述预训练模型得到;所述预训练模型基于对所述第一识别模型进行迁移学习所得到;
从所述第一识别结果、所述第二识别结果以及所述第三识别结果中,选取出现次数大于预设次数的实体,标识为风险主体;
将所述风险主体、所述风险主体的类别以及所述风险主体在所述待识别文本中的位置发送给所述客户端。
2.根据权利要求1所述的方法,其特征在于,所述在接收到客户端发送的待识别文本时之前,还包括:
在接收所述客户端发送的访问请求时,判断当前工作状态是否为异常工作状态;所述当前工作状态为所述服务器的工作状态;所述访问请求至少包括域名;
若所述当前工作状态不为所述异常工作状态时,则接收所述客户端发送的所述待识别文本;
若所述当前工作状态为所述异常工作状态时,则将所述域名进行修改,得到目标域名,并将所述目标域名发送给客户端,以使所述客户端利用所述目标域名访问目标服务器。
3.根据权利要求2所述的方法,其特征在于,还包括:
若所述当前工作状态为所述异常工作状态时,向所述客户端发送异常指令,以使所述客户端通过切换脚本修改所述域名,得到所述目标域名,并通过所述目标域名访问所述目标服务器。
4.根据权利要求1所述的方法,其特征在于,所述对所述待识别文本进行处理,得到字序列,包括:
删除所述待识别文本的无效字符,得到目标文本;
将所述目标文本进行分字处理,得到字序列。
5.根据权利要求1所述的方法,其特征在于,基于样本语料作为输入训练得到第一识别模型的过程,包括:
预先获取样本语料、与所述样本语料对应的实体标签、所述实体标签的类别、所述实体标签在所述样本语料所示文本中的位置;
删除所述样本语料中的无效字符,得到有效语料;
将所述有效语料进行分字处理,得到字训练序列;所述字训练序列包括多个字样本;
将各个所述字样本输入至初始模型中,经由所述初始模型的编码器对每个所述字样本进行编码,得到每个所述字样本的字向量、类别向量以及位置向量;所述初始模型包括所述编码器和任务损失函数;
将每个所述字样本的字向量、所述类别向量以及所述位置向量进行相加,得到每个字样本的特征向量;
将各个所述特征向量作为所述初始模型的所述任务损失函数的输入,计算得到样本语料的识别结果,不断调整所述任务损失函数的各项参数,直至识别结果的正确率大于预设阈值,确认所述第一识别模型训练成功。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210573905.2/1.html,转载请声明来源钻瓜专利网。