[发明专利]一种基于半监督学习的粮库清仓查库欺诈行为检测方法在审
| 申请号: | 202110727304.8 | 申请日: | 2021-06-29 |
| 公开(公告)号: | CN113570301A | 公开(公告)日: | 2021-10-29 |
| 发明(设计)人: | 王有权;曹杰;韩金广;陶海成;朱桂祥 | 申请(专利权)人: | 南京财经大学 |
| 主分类号: | G06Q10/08 | 分类号: | G06Q10/08;G06Q50/26;G06K9/62 |
| 代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
| 地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 监督 学习 粮库 清仓查库 欺诈 行为 检测 方法 | ||
本发明公开了一种基于半监督学习的粮库清仓查库欺诈行为检测方法,包括两个步骤,第一步骤为粮库欺诈行为特征产生,构建了6个判别是否存在欺诈行为的特征;第二步骤主要参数为基于半监督学习的粮库清仓查库欺诈行为检测方法设计,然后,针对粮库清仓查库中存在大量无标记粮库和少量的标记粮库特征数据的这一问题,提出了基于半监督ExpectationMaximization(EM)算法的粮库清仓查库欺诈行为检测方法;最后可以通过EM算法不断迭代来改进分类器的效果,从而提升了粮库清仓查库欺诈行为检测的效果。
技术领域
本发明涉及粮食仓库管理领域,尤其涉及一种基于半监督学习的粮库清仓查库欺诈 行为检测方法。
背景技术
粮库清仓查库欺诈行为可定义为个别粮库在未经批准的情况下擅自销售、动 用粮库的粮食;为套取贷款或补贴虚报库存;挪用销售款、伪造粮食损耗的现象。 粮库欺诈行为涉及到诸多方面,总体表现为从粮食数量和质量方面弄虚作假,因 而反欺诈对象范围可初步选为人为因素所致的粮食数量和质量异动,数据范围则 是与此相关的粮库人员参与行为所产生的痕迹信息,包括粮情、出入库、合同、 部分财务等几大类关联行为数据。
目前的国家和地方粮库的欺诈行为检测多采用人工手段或突击检查的方式来获取 相关的数据,总体上存在人工检查为主,这将耗费大量的人力物力和财力,且很难实时、准确、全面的掌握各粮库是否存在欺诈行为。目前来说针对粮库的单项检查目前开展了 很多,包括粮库温湿度检查、虫害检查、压力传感器、粮库实时监控系统等。但这些单 项系统或装备不能综合的获取粮食的数量、质量和环境等因素。
本发明从每个粮库的库存、财务、质量数据入手,通过数据分析和挖掘的角度来研究如何检测清仓查库欺诈行为。具体来说通过调研全国粮食清仓查库工作中查实的一些粮库欺诈行为典型历史案例,对欺诈行为的进行系统化地归纳,界定反欺诈的分类选择 范围和确立特征参数的筛选机制,为特征参数定义奠定语义基础。目前在该领域的研究 很少,且现实中的粮库清仓查库中,往往存在着大量的无标记粮库(即在粮库欺诈行为 分析和分类前,不通过算法检测很难判读其实正常的粮库行为还是欺诈行为)和少量的 标记粮库数据(即人工判别出的具有欺诈行为的粮库和正常粮库),由于标记数据很少, 如果直接用基于构建欺诈行为指标和分类器来检测粮库欺诈行为则效果不佳。
由于标记数据量非常小,基于监督学习的具有欺诈行为的检测方法的误差较大。而 无监督学习则没有利用现有的标记数据集,忽略了标记数据集对未标记数据集的影响,导致训练容易欠拟合。为此,本发明提出了一种基于半监督学习的粮库清仓查库欺诈行 为检测方法,首先使用极大似然估计作为分类工具,然后使用Expectation Maximization(EM)算法来改进分类器。相对于标记数据集,未标记数据集数据量极大, 未标记数据集对EM算法的参数估计过程起到决定性作用,从而提高粮库清仓查库欺诈 行为检测的准确性。
发明内容
本发明目的及后续的实施方式均是提供一种基于半监督学习的粮库清仓查库欺诈 行为检测方法。
本发明的技术方案是,一种基于半监督学习的粮库清仓查库欺诈行为检测方法,该 方法包括两个部分,第一部分为粮库欺诈行为特征产生,主要参数的第二部分为基于半监督学习的粮库清仓查库欺诈行为检测方法设计。本发明最后可以通过EM算法不断迭 代来改进分类器的效果,从而提升了粮库清仓查库欺诈行为检测的效果。
本发明的具体内容如下:
1)粮库欺诈行为特征产生
为了从无标记数据中找到存在欺诈行为的粮库,本发明主要基于存在欺诈行为的粮 库的行为特征来检测这些欺诈粮库行为,为此,我们定义了如下特征:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京财经大学,未经南京财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110727304.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可拆卸自动开门装置
- 下一篇:一种水体增氧方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





