[发明专利]一种海关进出口商品的申报质量评估方法在审
申请号: | 202211371246.0 | 申请日: | 2022-11-03 |
公开(公告)号: | CN115640400A | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 包先雨;李俊杰;蔡屹;黄孙杰;黄鹏;罗子鸣;邓鹤文;马乐铭;于鼎;张育铭 | 申请(专利权)人: | 深圳市检验检疫科学研究院;深圳大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F40/216;G06F40/289;G06Q10/063;G06Q10/10;G06Q50/26 |
代理公司: | 北京中仟知识产权代理事务所(普通合伙) 11825 | 代理人: | 丁瑞 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 海关 进出口商品 申报 质量 评估 方法 | ||
本发明涉及数据挖掘技术领域,公开了一种海关进出口商品的申报质量评估方法,包括以下步骤:S1、先对报关单数据集进行数据预处理,先通过基于Laplacian图谱的短文本聚类算法,将要素内容聚为若干个簇,并采用水库抽样的方式对每个簇进行抽样;S2、再嵌入基于类中心的样本删减策略,进一步减少候选标记样本集的样本量;S3、采用FastText模型,并引入不等概率的神经元丢弃法,对短文本进行二分类,可以对每张报关单计算要素对应上的平均概率,从而完成海关进出口商品的申报质量评估。本发明既不过分依赖于某些规则,也不需要消耗大量人工进行审核,有效地避免了不规范申报,实现自动识别报关单质量并实时预警的功能,满足了海关监察偷税漏税现象的业务需求。
技术领域
本发明涉及数据挖掘技术领域,具体是一种海关进出口商品的申报质量评估方法。
背景技术
报关单质量评估是中国海关智慧纪检的一个重要研究问题,中国海关在报关单审核方面,往往过度依赖以往经验进行机械式的电子审查,甚至每一单都会经过人工审核,这给海关的审核部门带来了极大的工作量,在此情况下,审核人员难免会出现一些差错,导致了不法分子利用不规范申报的方式,申报一个更低税率的商品编号而不被察觉,从中带来的极大税差作为他们的不法利润。
目前海关在报关单查验方面包括了电子查验、人工审核、现场接单审核等,但经过对真实的过往报关单的探究,依旧发现了大量不规范申报的案例,说明海关的查验依旧存在很大的问题,其原因在于电子查验过于机械化和经验化,以及人工查验过程中存在侥幸心理,甚至出现海关官员受贿的现象,从而未能实现精准查验;中国专利公开了一种基于知识图谱与树模型构造的海关检测生成方法(公告号CN111753928A),该专利技术建立了有效指标特征构建的规则系统,但是其旧过度依赖于专家规则,这些信息往往很难与时俱进,不法分子可能会试探性地摸清这个规则系统,通过设计新的不规范申报方案谋取利益;中国专利还公开了海关查验监控方法、装置、计算机设备和存储介质(公告号CN111798092A),该专利技术能够及时发现海关查验中的异常情况,但是其仅仅考虑了工作人员在查验时的异常,并未对报关单本身进行探究,而事实上许多时候出现的问题都归咎于报关单本身的申报质量。
发明内容
本发明的目的在于提供一种海关进出口商品的申报质量评估方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种海关进出口商品的申报质量评估方法,包括以下步骤:
S1、先对海关进出口商品的报关单数据集进行数据预处理,再采用等概率两阶段抽样方法将报关单样本集训练成视野广阔的候选标记样本集;在该抽样方法中,先通过基于Laplacian图谱的短文本聚类算法,将要素内容聚为若干个簇,要素内容即短文本,并采用水库抽样的方式对每个簇进行抽样;
S2、再嵌入基于类中心的样本删减策略,实现分类效果基本不改变的情况下,进一步减少候选标记样本集的样本量,;
S3、采用FastText模型,并引入不等概率的神经元丢弃法,对短文本进行二分类,抑制过拟合的同时保持准确高效的性能;经过短文本二分类后,对于每个商品编号下的商品,都将其打标为0或1,其中1表示与要素表相对应,即规范申报,0则表示与要素表不对应,即不规范申报,输出打标为1(规范申报)的概率;从而可以对每张报关单计算要素对应上的平均概率,即报关单的质量得分,进而完成海关进出口商品的申报质量评估。
作为本发明再进一步的方案:所述海关进出口商品的报关单数据集包括要素表和报关单;
所述要素表中记录每种商品编号对应的要素列表;
所述报关单中的不同种类商品拥有不同的商品编号,每种商品编号对应一种要素顺序,且报关单上有用的字段为“商品名称及规格型号”,其中包含的申报要素为品名、品牌、规格,规范申报时需将要素顺序和数量与要素表保持一致。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市检验检疫科学研究院;深圳大学,未经深圳市检验检疫科学研究院;深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211371246.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种面向分布式制造系统中异构设备的监控系统
- 下一篇:一种多功能髓针组件