[发明专利]物流对象信息处理方法、装置及计算机系统在审
| 申请号: | 201810943287.X | 申请日: | 2018-08-17 |
| 公开(公告)号: | CN110858219A | 公开(公告)日: | 2020-03-03 |
| 发明(设计)人: | 郑恒;张振华;李驰 | 申请(专利权)人: | 菜鸟智能物流控股有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06Q10/08 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 物流 对象 信息处理 方法 装置 计算机系统 | ||
1.一种物流对象信息处理方法,其特征在于,包括:
确定待归类的目标物流对象的文本描述信息并对所述文本描述信息进行处理,确定包含的目标特征词;
根据所述文本描述信息对各目标特征词的包含情况,生成该目标物流对象对应的特征词向量;
将所述特征词向量输入到编码分类模型中,获取对应的分类特征信息。
2.根据权利要求1所述的方法,其特征在于,编码分类模型包括逻辑回归模型、决策树模型、神经网络模型。
3.根据权利要求2所述的方法,其特征在于,若所述编码分类模型为逻辑回归模型,则所述编码分类模型保存有每个编码对应的特征词权重向量。
4.根据权利要求3所述的方法,其特征在于,所述编码包海关编码HScode,所述编码分类模型中保存有每个海关编码HScode对应的特征词权重向量;所述特征词权重向量中记录有各个特征词对关联HScode的判别权重值。
5.根据权利要求2所述的方法,其特征在于,若所述编码分类模型为决策树模型,则所述编码分类模型保存有多棵树模型,以及基于每棵树保存有分裂的阈值以及特征词向量的特征,以便确定所述目标物流对象被归类于每个潜在编码对应类别的概率。
6.根据权利要求2所述的方法,其特征在于,若所述编码分类模型为神经网络模型,则所述编码分类模型具有多层的非线性变化单元,每一层的非线性变化单元与下一层非线性变化单元串联,每一层非线性变化单元保存有基于特征词向量或由特征词向量衍生特征向量的特征权重,以便通过多层非线性变化单元的相互作用得到物流对象被归类于每个潜在编码对应类别的概率。
7.根据权利要求1所述的方法,其特征在于,
所述将所述特征词向量输入到编码分类模型中,获取对应的分类特征信息,包括:
将所述特征词向量输入到编码分类模型中,确定所述目标物流对象被归类于各潜在编码对应类别的概率。
8.根据权利要求7所述的方法,其特征在于,还包括:
根据所述概率提供分类建议信息。
9.根据权利要求3或7所述的方法,其特征在于,
所述编码分类模型通过以下方式建立:
收集训练样本,其中,每条训练样本中包括已知的物流对象文本描述信息与海关编码HScode之间的对应关系;
对所述训练样本中的文本描述信息进行分词处理,并过滤掉无效词汇,得到特征词;
将各条训练样本中得到的特征词进行汇总及去重处理,得到特征词集合,并分别为各个特征词分配对应的序号;
根据各条训练样本中对各序号上的特征词的包含情况,生成各条训练样本对应的特征词向量;
分别将同一HScode关联的多条训练样本对应的特征词向量输入到预置的机器学习模型中进行训练,得到各HScode分别对应的编码分类模型。
10.根据权利要求9所述的方法,其特征在于,
所述生成该目标物流对象对应的特征词向量,包括:
根据所述目标物流对象的文本描述信息中对各序号上的特征词的包含情况,生成该目标物流对象对应的特征词向量。
11.根据权利要求9所述的方法,其特征在于,
所述收集训练样本之后,还包括:
对所述训练样本进行数据清洗,以便利用剩余的有效训练样本进行分类模型的训练。
12.根据权利要求11所述的方法,其特征在于,
所述对所述训练样本进行数据清洗包括:
预先保存新旧HScode映射关系信息;
对于出现旧HScode的训练样本,根据所述映射关系替换为新HScode后,再作为有效训练样本加入到训练样本集合中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于菜鸟智能物流控股有限公司,未经菜鸟智能物流控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810943287.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据查询方法及装置
- 下一篇:一种三角洲相单一期次河道砂体平面分布的描述方法





