[发明专利]一种海关进出口商品的申报质量评估方法在审
申请号: | 202211371246.0 | 申请日: | 2022-11-03 |
公开(公告)号: | CN115640400A | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 包先雨;李俊杰;蔡屹;黄孙杰;黄鹏;罗子鸣;邓鹤文;马乐铭;于鼎;张育铭 | 申请(专利权)人: | 深圳市检验检疫科学研究院;深圳大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F40/216;G06F40/289;G06Q10/063;G06Q10/10;G06Q50/26 |
代理公司: | 北京中仟知识产权代理事务所(普通合伙) 11825 | 代理人: | 丁瑞 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 海关 进出口商品 申报 质量 评估 方法 | ||
1.一种海关进出口商品的申报质量评估方法,其特征在于,包括以下步骤:
S1、先对海关进出口商品的报关单数据集进行数据预处理,再采用等概率两阶段抽样方法将报关单样本集训练成视野广阔的候选标记样本集;在该抽样方法中,先通过基于Laplacian图谱的短文本聚类算法,将要素内容聚为若干个簇,要素内容即短文本,并采用水库抽样的方式对每个簇进行抽样;
S2、再嵌入基于类中心的样本删减策略,实现分类效果基本不改变的情况下,进一步减少候选标记样本集的样本量;
S3、采用FastText模型,并引入不等概率的神经元丢弃法,对短文本进行二分类,抑制过拟合的同时保持准确高效的性能;经过短文本二分类后,对于每个商品编号下的商品,都将其打标为0或1,其中1表示与要素表相对应,即规范申报,0则表示与要素表不对应,即不规范申报,输出打标为1(规范申报)的概率;从而可以对每张报关单计算要素对应上的平均概率,即报关单的质量得分,进而完成海关进出口商品的申报质量评估。
2.根据权利要求1所述的一种海关进出口商品的申报质量评估方法,其特征在于,所述海关进出口商品的报关单数据集包括要素表和报关单;
所述要素表中记录每种商品编号对应的要素列表;
所述报关单中的不同种类商品拥有不同的商品编号,每种商品编号对应一种要素顺序,且报关单上有用的字段为“商品名称及规格型号”,其中包含的申报要素为品名、品牌、规格,规范申报时需将要素顺序和数量与要素表保持一致。
3.根据权利要求2所述的一种海关进出口商品的申报质量评估方法,其特征在于,所述S1步骤中的数据预处理包括要素提取与要素数量筛选,
所述要素提取的流程如下:对报关单中的“商品名称及规格型号”字段的内容进行字符串拆分,每个报关单得到一组要素字段;
所述要素数量筛选的流程如下:通过要素字段得到报关单要素数据,并判断报关单的要素数据的数量与对应要素表中的要素列表内的数量是否一致,当一致时,则生成报关单样本集,否则判断为不规范数据。
4.根据权利要求1所述的一种海关进出口商品的申报质量评估方法,其特征在于,所述S1步骤中的等概率两阶段抽样方法包括以下步骤:
S11、针对报关单样本集中的每一种要素样本集,先取频数最高的前P%作为直接纳入训练样本;
S12、再通过基于Laplacian图谱的短文本聚类算法,对剩余1-P%的样本进行文本聚类,将要素内容聚为若干个簇,然后在每个簇中随机抽样Q%;其中,P%和Q%可在0和1之间进行调节;
在每个簇中的随机抽样中,采用水库抽样方法进行实现;设定S[N]为样本集合、R[K]为结果集合、N为S数组的大小、J为每次的随机数、K为抽取的样本数、i为迭代次数。
5.根据权利要求4所述的一种海关进出口商品的申报质量评估方法,其特征在于,所述水库抽样的实现方法包括以下步骤:
S111、取S集合中前K个数填入集合R;
S112、从S[K]开始遍历,生成随机数J,范围为[0,K+i-1];若JK,则替换R中的值,即R[j]=S[i];
S113、遍历结束,生成结果数组R;最终得到报关单候选标记样本集Di。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市检验检疫科学研究院;深圳大学,未经深圳市检验检疫科学研究院;深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211371246.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种面向分布式制造系统中异构设备的监控系统
- 下一篇:一种多功能髓针组件