[发明专利]一种基于半监督学习的粮库清仓查库欺诈行为检测方法在审
| 申请号: | 202110727304.8 | 申请日: | 2021-06-29 |
| 公开(公告)号: | CN113570301A | 公开(公告)日: | 2021-10-29 |
| 发明(设计)人: | 王有权;曹杰;韩金广;陶海成;朱桂祥 | 申请(专利权)人: | 南京财经大学 |
| 主分类号: | G06Q10/08 | 分类号: | G06Q10/08;G06Q50/26;G06K9/62 |
| 代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
| 地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 监督 学习 粮库 清仓查库 欺诈 行为 检测 方法 | ||
1.一种基于半监督学习的粮库清仓查库欺诈行为检测方法,其特征是,包括两个步骤,第一步骤为粮库欺诈行为特征产生,第二步骤主要参数为基于半监督学习的粮库清仓查库欺诈行为检测方法设计,具体内容如下:
1)粮库欺诈行为特征产生
为了从无标记数据中找到存在欺诈行为的粮库,基于存在欺诈行为的粮库的行为特征来检测这些欺诈粮库行为,为此,定义如下特征:
(1)每个粮库在特定时间段T内的粮食出入库数量一致性特征WTC:设第i个粮库在时间跨度T(通常为1年)中入库后的每天粮食总量分别为{q1,q2,…,qT},而在出库后的每天的剩余粮食的总量为{o1,o2,…,oT},则粮库i的粮食在特定时间段内的出入库时间一致性特征WTCi表示为:
(2)每个粮库在特定时间段T内的大米出入库数量一致性特征RTC:设第i个粮库在时间跨度T(通常为1年)中入库后的每天粮食总量分别为{c1,c2,…,cT},而在出库后的每天的剩余粮食的总量为{a1,a2,…,aT},则粮库i的粮食在特定时间段内的出入库时间一致性特征WTCi可表示为:
(3)每个粮库在特定时段T内抽检粮食的年份一致性WYC:在第j次抽检粮食的年份与真实记录的年份的相同则记aj=1,否则记aj=0,设第i个粮库在时间跨度T中共计抽检了D次,则粮库i在特定时段T内抽检小麦的年份一致性WYC表示为:
(4)每个粮库在特定时段T内抽检大米的年份一致性RYC:在第j次抽检大米的年份与真实记录的年份的相同则记βj=1,否则记βj=0,设第i个粮库在时间跨度T(通常为1年)中共计抽检了D次,则粮库i在特定时段T内抽检大米的年份一致性WYC表示为:
(5)每个粮库在在特定时段T内抽检粮食的质量的合格率一致性WQQ:为了度量粮食的合格率,设置第j次抽检时当前粮食参数和入库记录的粮食的参数的一致性,如果一致则设置为1,否则设置为0,参数包括不完善粒百分比一致性杂质总含量百分比一致性矿物质含量百分比一致性水分含量百分比一致性互混率一致性以及容量一致性假设特定时段T内抽检次数为D则粮库i在特定时段T内抽检粮食的质量的合格率一致性WQQ表示为:
(6)每个粮库在在特定时段T内抽检大米的质量的合格率一致性RQQ:为了度量粮食的合格率,设置第j次抽检时当前粮食参数和入库记录粮食的参数的一致性,如果一致则设置为1,否则设置为0,参数包括杂质含量百分比一致性整精米率一致性出糙率一致性水分含量百分比一致性黄粒米含量一致性谷外糙米含量一致性以及互混率一致性假设特定时段T内抽检次数为D则粮库i在特定时段T内抽检大米的质量的合格率一致性RQQ表示为:
2)基于半监督学习的粮库清仓查库欺诈行为检测方法
(1)参数初始化
基于半监督学习的粮库清仓查库欺诈行为检测方法,用于发现粮库清仓查库中的具有欺诈行为的粮库;初始输入是每个粮库的欺诈行为特征,如果粮库的类别已知,则其属于标记数据集L,否则属于未标记数据集U。L={(g1,c1),(g2,c2),…,(g/L/,c/L/)}为标记数据集,(g1,g2,…,g/L/)表示粮库集合,(c1,c2,,…,C/L/)表示该粮库的类型集合,而U={g’1,g’2,…,g’|U|}为未标记数据集;
粮库欺诈行为检测算法通过函数f来预测未标记粮库属于正常粮库normal(N)还是具有欺诈行为的粮库fake(S);具体方法如下:
获得标记和未标记数据集的6个指标后,在标记数据集上初始朴素贝叶斯分类器,然后根据此分类器属于normal(N)和fake(S)的概率,由于6个检测指标都是相互独立的,因此,使用朴素贝叶斯分类来初始化未标记粮库属于类别C的概率,其中C={S,N}。首先获取每个粮库的6个指标值,记为{gi1,gi2,gi3,gi4,gi5,gi6},而粮库gij表示粮库gi第j个指标,且符合均值为μj,标准差为σj的高斯分布,则P(gi|C)表示未标记粮库gi的第j个指标属于类C的概率,故其可用式(7)所示:
和为标记数据集的第j个指标属于类c的均值和标准差,然后可通过式(8)获得粮库gi属于类c的概率,式(8)如下所示:
通过式(7)和(8)可以获得未标记粮库属于正常粮库或具有欺诈行为的粮库的初始概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京财经大学,未经南京财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110727304.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可拆卸自动开门装置
- 下一篇:一种水体增氧方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





