[发明专利]一种面向电信欺诈案件受害者的人格特征检测方法在审
申请号: | 202211459855.1 | 申请日: | 2022-11-16 |
公开(公告)号: | CN115712728A | 公开(公告)日: | 2023-02-24 |
发明(设计)人: | 黄海辉;胡锦浩;马创;刘帅武;冉鑫;颜莉 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F18/2431;G06F18/2411;G06F18/2451;G06F40/284;G06F21/62 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 卢胜斌 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 电信 欺诈 案件 受害者 人格 特征 检测 方法 | ||
本发明属于人格特征预测领域,具体涉及一种面向电信欺诈案件受害者的人格特征检测方法,包括:对案件文本数据信息进行预处理;利用正则表达式按照预定义的脱敏规则对预处理后的数据信息进行隐私保护处理;建立人格特征检测模型,将隐私保护处理后的数据信息输入人格特征检测模型获取相应的大五人格特征得分。本发明能够实现对电信欺诈案件受害者的人格特征分析,提高了人格特征检测精度,为电信欺诈案件受害者的人格特征检测提供技术支持。
技术领域
本发明属于人格特征预测领域,具体涉及一种面向电信欺诈案件受害者的人格特征检测方法。
背景技术
传统刑侦方式从犯罪手段层面进行分析,不利于理解犯罪的案发规律,对欺诈案件的防范具有一定的滞后性。而每位欺诈受害者在被欺诈过程中都有不同的心理特质,从欺诈犯罪心理层面对犯罪行为进行探究,可以深入理解被欺诈时受害者的心理状态。而人格特征是一个人所有行为、动机、思维方式以及情绪的组合特性,对于每个人平时的所做选择以及生活都产生了巨大的影响。通过得到各类案件中受害者的人格特征,能分析出各类型受害者对何种引诱信息具有偏好,进而从普通民众的心理层面采取相应措施防范欺诈案件的发生。目前已有一些研究通过文本信息分析用户人格特征,但是这些研究大多基于词频法,矩阵分解以及主题模型等方法。这些方法的局限性在于检测性能依赖于研究者的先验知识,对于复杂样本的检测缺少可靠性。还有一些研究者提出了基于深度学习的人格特征检测,比如分层CNN模型以及多任务学习等方法。虽然这些方法在精度上有了较大的提升,但是这些方法在不同群体的样本检测中精度差异性较大,存在可解释性较差的情况。
发明内容
为解决上述技术问题,本发明提出一种面向电信欺诈案件受害者的人格特征检测方法,包括:
S1,对案件文本数据信息进行预处理;
S2,按照预定义的脱敏规则对预处理后的数据信息进行隐私保护处理;
S3、建立人格特征检测模型,将隐私保护处理后的数据信息输入人格特征检测模型获取相应的大五人格特征得分。
优选的,对案件文本数据信息进行预处理,包括:利用Python内置的jieba 库对案件文本信息数据进行停用词处理。
优选的,对数据隐私保护处理,包括:
S21:建立自定义的脱敏规则;
所述脱敏规则包括:剔除案件文本信息中的身份证号、电话号码以及住址等用户隐私信息;
S22:通过建立的脱敏规则对数据信息的文本进行脱敏处理。
优选的,所述人格特征检测模型,包括:Bert层、多分类层;
所述多分类层:组合多个二分类器,得到多分类器,并预设五大人格特征,将数据输入多分类器,实现五大人格的分类;
所述五大人格特征包括:外向性、神经质性、宜人性、尽责性、开放性。
优选的,将隐私保护处理后的数据信息输入人格特征检测模型获取相应的大五人格特征得分,包括:
S31:将隐私处理之后的数据信息输入到Bert层中进行文档划分,将数据信息的文档长度大于512的进行截断,文档长度不足512的用无用词填充,并转换为句向量;
S32:将句向量与Francois Mairesse开发的具有84个特征组成的人格特征检测数据集进行连接,得到整个案件信息的文档特征向量;
S33:将整个案件信息的文档特征向量输入多分类层,第一层SVM分类器中进行二分类判断,得出人格特征的偏好得分,根据偏好得分判断是否属于五大人格的某种人格特征,如果不是就再输入到下一层SVM中进行相应的判断,直至判断出相应的大五人格特征为止;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211459855.1/2.html,转载请声明来源钻瓜专利网。