[发明专利]提升审计精度的方法及系统在审
申请号: | 202011103618.2 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112241512A | 公开(公告)日: | 2021-01-19 |
发明(设计)人: | 王洪贺;孙永强 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G06F17/18 | 分类号: | G06F17/18 |
代理公司: | 成都虹桥专利事务所(普通合伙) 51124 | 代理人: | 吴中伟 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提升 审计 精度 方法 系统 | ||
本发明涉及数据审计领域,具体涉及一种提升审计精度的方法及系统,解决了设计数据中出现的偏差,极大地提高了审计精度。提升审计精度的方法,包括:对数据进行预处理,确定审计数据;对审计数据运用格拉布斯检验法剔除异常值,进行数据清洗;根据清洗之后的数据建立正态分布模型并进行仿真;在仿真过程中,引入偏度以及峰度模型修正正态分布模型提升审计精度。本发明适用于提升审计精度。
技术领域
本发明涉及数据审计领域,具体涉及一种提升审计精度的方法及系统。
背景技术
在审计领域数据的录入的过程中,由于各种因素导致录数据可能出现异常,一般数据都是由业务人员凭借人工进行统计,简单分析,没有系统的数据分析方法。审计领域中现有的数据分析方法是依靠审计人员的经验进行人工检测,效率比较低下。而在其他有类似需求的领域,则是基于统计法的检验方法,但是由于审计领域的数据量非常大,首先需要根据需求对大量的数据进行分组,然后再对每组数据进行分析,而其他领域的分析方法并未考虑到审计领域的数据特征,所以难以应用在审计领域中。因此,引入机器学习针对审计系统进行数据分析,可以合理高效的利用审计系统数据,提炼有价值数据,增强审计系统时效性成为时代的主流。
在机器学习的众多算法中,统计分析是最基本的算法,包含许多重要的模型,为其他机器学习算法提供训练样本等,其中概率分布模型是统计分析中最重要的组成部分,正态分布又名高斯分布,是一个在数学、物理及工程等领域都非常重要的概率分布,若随机变量服从一个位置参数、尺度参数为的概率分布,记为:则其概率密度函数为正态分布的数学期望值或期望值等于位置参数,决定了分布的位置;其方差的开平方或标准差等于尺度参数,决定了分布的幅度。正态分布的概率密度函数曲线呈钟形,因此又经常称之为钟形曲线。
审计系统采购信息记录物料价格是连续型变量,故排除离散型分布;经过基本的统计分析以及对业务场景的了解,判定同一物料的大部分采购信息价格处在均值附近,存在少量异常值,故排除均匀分布和指数分布。
正态分布是许多统计方法的理论基础。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。
现有数据审计,仅仅依赖正态分布模型,只经过正态分布模型处理的数据,往往存在偏差,因此导致审计精度不高,图3为现有审计精度指标图,从图中看出其审计精度存在大量离散点。
发明内容
本发明的目的是提供一种提升审计精度的方法及系统,解决了设计数据中出现的偏差,极大地提高了审计精度。
本发明采取如下技术方案实现上述目的,提升审计精度的方法,包括:
步骤(1)、对数据进行预处理,确定审计数据;
步骤(2)、对审计数据运用格拉布斯检验法剔除异常值,进行数据清洗;
步骤(3)、根据清洗之后的数据建立正态分布模型并进行仿真;
步骤(4)、在仿真过程中,引入偏度以及峰度模型修正正态分布模型提升审计精度。
进一步的是,在步骤(2)中,异常值包括:人工录入的异常数据以及审计系统存在的异常数据。
进一步的是,在步骤(2)中,运用格拉布斯检验法剔除异常值的具体方法包括:
21、对原始审计数据进行异常值剔除以及异常离散值剔除;
22、剔除异常值及异常离散值后,确定审计数据中的最大值和最小值;
23、将最大值及最小值与审计数据均值差值最大的的值作为可疑值;
24、运用格拉布斯模型剔除可疑值,并进行二次格拉布斯模型异常值剔除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011103618.2/2.html,转载请声明来源钻瓜专利网。