[发明专利]一种面向电信欺诈案件受害者的人格特征检测方法在审
申请号: | 202211459855.1 | 申请日: | 2022-11-16 |
公开(公告)号: | CN115712728A | 公开(公告)日: | 2023-02-24 |
发明(设计)人: | 黄海辉;胡锦浩;马创;刘帅武;冉鑫;颜莉 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F18/2431;G06F18/2411;G06F18/2451;G06F40/284;G06F21/62 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 卢胜斌 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 电信 欺诈 案件 受害者 人格 特征 检测 方法 | ||
1.一种面向电信欺诈案件受害者的人格特征检测方法,其特征在于,包括:
S1:对案件文本数据信息进行预处理;
S2:按照预定义的脱敏规则对预处理后的数据信息进行隐私保护处理;
S3:建立人格特征检测模型,将隐私保护处理后的数据信息输入人格特征检测模型获取相应的大五人格特征得分。
2.根据权利要求1所述的一种面向电信欺诈案件受害者的人格特征检测方法,其特征在于,对案件文本数据信息进行预处理,包括:利用Python内置的jieba库对案件文本信息数据进行停用词处理。
3.根据权利要求1所述的一种面向电信欺诈案件受害者的人格特征检测方法,其特征在于,对数据隐私保护处理,包括:
S21:建立自定义的脱敏规则;
所述脱敏规则包括:剔除案件文本信息中的身份证号、电话号码以及住址等用户隐私信息;
S22:通过建立的脱敏规则对数据信息的文本进行脱敏处理。
4.根据权利要求1所述的一种面向电信欺诈案件受害者的人格特征检测方法,其特征在于,所述人格特征检测模型,包括:Bert层、多分类层;
所述多分类层:组合多个二分类器,得到多分类器,并预设五大人格特征,将数据输入多分类器,实现五大人格的分类;
所述五大人格特征包括:外向性、神经质性、宜人性、尽责性、开放性。
5.根据权利要求1所述的一种面向电信欺诈案件受害者的人格特征检测方法,其特征在于,将隐私保护处理后的数据信息输入人格特征检测模型获取相应的大五人格特征得分,包括:
S31:将隐私处理之后的数据信息输入到Bert层中进行文档划分,将数据信息的文档长度大于512的进行截断,文档长度不足512的用无用词填充,并转换为句向量;
S32:将句向量与Francois Mairesse开发的具有84个特征组成的人格特征检测数据集进行连接,得到整个案件信息的文档特征向量;
S33:将整个案件信息的文档特征向量输入多分类层,第一层SVM分类器中进行二分类判断,得出人格特征的偏好得分,根据偏好得分判断是否属于五大人格的某种人格特征,如果不是就再输入到下一层SVM中进行相应的判断,直至判断出相应的大五人格特征为止;
S34:将多分类层的输出的对应人格的人格特征偏好得分取平均数,得到最终的人格特征的偏好得分。
6.根据权利要求5所述的一种面向电信欺诈案件受害者的人格特征检测方法,其特征在于,Bert层将数据信息转换为词向量,包括:
通过从输入数据信息的一句话中提取15%的次进行预测,同时随机抹除部分数据,将这些数据以80%的概率使用特殊符号[MASK]进行替换,10%的概率使用任意词替换,剩下的10%概率保持原词不变,得到将数据信息转化为具有上下文关联的词向量,按顺序将词向量拼接得到每行数据的句向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211459855.1/1.html,转载请声明来源钻瓜专利网。