[发明专利]基于识别学习建立财务欺诈识别模型的方法在审
申请号: | 201911152139.7 | 申请日: | 2019-11-22 |
公开(公告)号: | CN112949954A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 张捷 | 申请(专利权)人: | 张捷 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/00;G06N3/08 |
代理公司: | 徐州拉沃智佳知识产权代理有限公司 32455 | 代理人: | 陈永宁 |
地址: | 224000 江苏省盐城市城南新区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 识别 学习 建立 财务 欺诈 模型 方法 | ||
本发明提供一种基于识别学习建立财务欺诈识别模型的方法,包括以下步骤:1)数据处理:获取样本数据,需要对样本数据进行清洗,样本数据清洗要清除错误点,冗余点和噪声,统一数据的量纲;2)构建印象管理特征:根据初步建立的文本框架,得到样本公司发布的文本信息的结构化数据,分别是包括社交行为特征、情绪特征和可读性特征;步骤3)选择财务变量:明确财务指标,分析每个财务指标的重要性与重要性排序,确定模型的输入变量;步骤4)制定模型评价标准:构建评价模型的好坏的混淆矩阵以及评价指标;步骤5)构建模型:选择分类器并对比分析,寻找最佳参数。本发明选取常用的财务指标,分类器来构建模型,同时采用印象管理特征来优化模型。
技术领域
本发明属于财务防欺诈技术领域,具体涉及一种基于识别学习建立财务欺诈识别模型的方法。
背景技术
大数据时代下中国金融证券市场蓬勃发展,随之而来的财务欺诈问题也越来越受到投资者和监管者的重视。上市公司的财务欺诈行为使得投资者做出基于错误信息的错误决策,损害了投资者的利益,扰乱了经济秩序,引发了信任危机,危害极大。因此,构建一个有效的上市公司财务欺诈识别模型意义重大。目前,企业内部审计只能发现15%的财务舞弊行为,40%的财务舞弊行为被发现是依靠内部员工和外部合作伙伴的举报,也就是说,目前还没有一个行之有效的技术手段能够准确检测财务欺诈行为。传统审计方法主要依赖于检查、观察、询问、函证、重新计算、重新执行以及分析程序,已不能满足大数据时代下的审计要求。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科;它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。现有技术中,机器学习中三个已经被验证性能较好的分类器:支持向量机、人工神经网络和梯度提升树(GBDT)来建立模型与比较分析;其中,支持向量机通过最短距离法寻找分类超平面,适用于高维度的数据,可以减少过度拟合;人工神经网络应用得最早,应用的领域也非常广,它能够很好地模拟非线性数据。GBDT预测精度高,可以灵活处理包括连续值和离散值在内各种类型的数据,对异常值的鲁棒性较强。下面对这三种方法逐一介绍。
(一)支持向量机(Support Vector Machine,SVM)是Cortes Corinna、Vladimir NVapnik等人在1993年提出并在1995年发表的一种在回归分析和分类问题中分析数据集,基于统计学习理论的VC维理论和结构风险最小原理的监督式学习模型的机器学习算法。虽然推动支持向量机的数学基础已经存在了几十年了,但是它们近年来才被普遍大量应用。支持向量机不但性能先进,而且它能较好地解决非线性、小样本等实际问题,几乎适用于所有的学习任务,包括分类和数值预测两个方面,目前已广泛应用于生物信息学领域如癌症预测和遗传疾病的微阵列基因表达数据的分类、文本分类如文档所用的语言和文档主题分类、状态评估、罕见却重要的时间检测如故障诊断和安全漏洞、模式识别等各个领域。
支持向量机的目标是创建一个超平面(hyperplane)边界,并把数据所在空间进行划分成具有相似值的组,得到任意一边都相当均匀的分区,它的底层逻辑是在数据中找到用于构建最优超平面的支持向量,一般认为这属于求解一个二次优化问题。
(二)人工神经网络是对一组输入数据集和一组输出数据集之间的关系进行建模,所使用的模型就来自于动物大脑对来自感觉输入的刺激是如何反应的理解,对动物的神经网络进行了抽象,就像大脑使用的一个称为神经元(neuron)的相互连接的细胞网络来构建一个巨大的并行处理器一样,人工神经网络使用人工神经元(也称为节点),然后对应不同的神经元连接方式,构成不同的网络来解决学习问题。
与传统的回归方法相比,神经网络具有以下特点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张捷,未经张捷许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911152139.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理