[发明专利]一种HS编码自动检索归类的方法及系统在审
申请号: | 202110264452.0 | 申请日: | 2021-03-11 |
公开(公告)号: | CN112765308A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 李静 | 申请(专利权)人: | 四川丝路易购科技有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F40/289;G06F40/268;G06F40/30;G06F16/33;G06F16/35;G06N3/02;G06Q10/08 |
代理公司: | 成都睿道专利代理事务所(普通合伙) 51217 | 代理人: | 薛波 |
地址: | 610200 四川省成都市双流*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 hs 编码 自动 检索 归类 方法 系统 | ||
本发明提供了一种HS编码自动检索归类的方法及系统,包括步骤:对待判定的商品描述信息并进行中文分词,识别词性和语义特征;对信息执行清洗操作获取关键词;采用图注意力网络建模商品描述信息中关键词之间的关联关系;计算关键词的第一权重;通过Textrank算法计算关键词的第二权重;基于关键词第二权重大小生成关键词序列;基于关键词序列对原始语料库执行过滤获取相关领域的领域语料数据;基于关联关系在领域语料数据中获取初步匹配文本;基于第二权重计算初步匹配文本与关键词序列的相关度;基于所计算出的相关度确定商品HS编码。本发明解决了进出口企业、跨境电商等HS编码归类难的问题,降低了贸易环节成本,提高了工作效率。
技术领域
本发明涉及国际贸易中进出口货物管理技术领域,具体而言,涉及一种HS编码自动检索归类的方法及系统。
背景技术
随着跨境贸易的快速增长,对通关商品快速、准确的分类越来越受到相关部门的重视。世界海关组织制定了协调制度(Harmonized System,HS)编码,以数字编码的形式代表和识别跨境贸易的货物。海关商品HS编码分类是根据商品描述信息为待分类商品找到最准确的10位HS类别代码的过程。如果能够高效、准确地实现HS编码分类,将有助于进出口企业、跨境电商等在进行进出口货物、包裹等报检报关信息填写时实现HS编码自动检索归类,降低人为因素的影响。
发明内容
本发明旨在提供一种HS编码自动检索归类的方法及系统,用于为进出口企业、跨境电商等在进行进出口货物、包裹等报检报关信息填写时实现HS编码自动检索归类,降低人为因素的影响,提高HS编码归类的效率。
本发明的实施例通过以下技术方案实现:一种HS编码自动检索归类的方法,其特征在于,包括如下步骤:
步骤一、获取待判定的商品描述信息;
步骤二、对所述商品描述信息进行中文分词,识别每个词语的词性和语义特征;
步骤三、基于所述词性和语义特征对所述商品描述信息执行清洗操作,获取关键词;
步骤四、采用图注意力网络建模所述商品描述信息中关键词之间的关联关系;
步骤五、根据所述关键词的位置、词性、语义特征和关联关系,结合预设的权重设置,得到所述商品描述信息中所述关键词的第一权重;
步骤六、通过Textrank算法,构建所述商品描述信息的语料文本图,并根据所述语料文本图和第一权重,计算所述关键词的第二权重;
步骤七、根据所述关键词的第二权重大小对关键词进行排序,生成关键词序列;
步骤八、基于所述关键词序列对原始语料库执行过滤操作,获取与所述商品描述信息相关领域的领域语料数据;
步骤九、基于前述所得的关联关系在所述领域语料数据中获取一个或多个初步匹配文本;
步骤十、基于前述所得的第二权重,计算所述初步匹配文本与所述关键词序列的相关度;
步骤十一、基于所计算出的相关度,从原始语料库所对应的HS编码中确定商品HS编码。
根据一种优选实施方式,所述步骤四具体包括:
步骤4.1、计算关键词之间的注意力分数,具体公式表达为:
式中,为关键词vi和vj的注意力分数,a为权重向量,和分别为关键词vi和vj的线性变换结果;
步骤4.2、使用Softmax对注意力分数标准化,得到:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川丝路易购科技有限公司,未经四川丝路易购科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110264452.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种潜水式增氧机的涡轮组件
- 下一篇:手持无线打蛋器