[发明专利]一种电商商品的品目预测机器人及其实现方法有效

专利信息
申请号: 202211300861.2 申请日: 2022-10-24
公开(公告)号: CN116186249B 公开(公告)日: 2023-10-13
发明(设计)人: 郑新刚;邱华淞;严友金;陈诚;林铖伟;王赛;雷晶强 申请(专利权)人: 数采小博科技发展有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F18/241;G06N5/046;G06N3/0455;G06N3/09;G06F18/214;G06N3/047
代理公司: 福州市京华专利代理事务所(普通合伙) 35212 代理人: 王美花
地址: 350200 福建省福州市长乐区文武砂*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 商品 品目 预测 机器人 及其 实现 方法
【权利要求书】:

1.一种电商商品的品目预测机器人,其特征在于:所述计算机程序的实现方法包括:

环境搭建过程,下载bert预训练语言模型bert-base-chinese;通过海量无标注语料对下载的所述bert预训练语言模型bert-base-chinese进行预训练,得到预训练后bert模型;该海量无标注语料未作商品标题的标注;

模型微调过程,基于品目库标准构建品目标签集文件class.txt,供预训练后bert模型读取;将品目清单进行one-hot编码形成标签矩阵;选取run_classifier.py文件作为下游分类任务的分类器;在所述run_classifier.py文件中关联数据集文件、品目标签集文件class.txt和初始模型参数列表,从而能加载标注数据集C和所述标签矩阵作为分类器的输入,加载初始模型参数列表并配置初始学习率参数值后运行分类器,通过分类器对输入的各个商品标题信息进行所属品目的推理,列出推理结果;重新配置学习率参数值和模型参数列表,继续运行分类器,并进行推理,如此反复,得到多个推理能力不同的bert模型;选择分类器推理能力最高的bert模型作为最佳模型,并保存最佳模型的模型参数列表;

模型评估过程,运行所述最佳模型,加载所述最佳模型的模型参数列表;输入测试数据集核验输出结果的置信度,核验模型对商品归类的准确率,若准确率低于阈值,则重新配置学习率取值和模型参数列表后再进行模型微调,直到准确率不低于阈值时结束,此时得到的bert模型即为所述电商商品的品目预测机器人;

其中,所述下游分类任务是用于将商品标题信息文本分为若干商品类目;所述标注数据集C标注了商品标题和品目标签;所述模型参数列表包括商品属性、名称和品牌的相关参数;所述测试数据集为一定数量的商品标题信息的数据集。

2.根据权利要求1所述的一种电商商品的品目预测机器人,其特征在于:所述学习率参数值配置为2×10-5 ~ 5×10-5之间;

且所述对输入的各个商品标题信息进行所属品目的推理是:先将输入某个商品标题信息中的汉字预处理转为整数编码,每个汉字对应一个整数后再进行推理。

3.根据权利要求1或2所述的一种电商商品的品目预测机器人,其特征在于:所述模型微调过程采用的算法具体是:

采用如下目标函数训练LM语言模型:

P(wi | w1, ..., wi-1, wi+1, ..., wn)

所述品目标签集文件train.csv从所述标注数据集C中读取商品标题X作为输入,将商品标题X从汉字级别进行拆分,得到n个汉字,把每个汉字进行特征转换为整数编码,得到n个整数编码W1, …, Wn,输出为品目清单的一个分类的one-hot标签y;

把所述整数编码W1, …, Wn输入至Transformer模型,得到最上层最后一个时刻的输出集hn l,将hn l通过softmax层进行分类,所述softmax层的参数为Wy,Wy为某个one-hot标签y的标签编码,最后用CrossEntropyLoss计算损失,调整Transformer模型的学习率以及参数Wy,等价于最大似然估计:

L1还是之前语言模型的损失,使用的数据为当前任务的标注数据集C,而且只使用其中的商品标题X,而不需要one-hot标签y;

L2是微调过程中的损失,使用的数据为当前任务的标注数据集C,同时使用其中的商品标题X和one-hot标签y;

L3是最大似然值,即为置信度。

4.根据权利要求1所述的一种电商商品的品目预测机器人,其特征在于:所述推理结果的输出是一个数组,数组的每个元素的值表示一个商品品目的置信度,每个元素的值为0.00-1.00之间,数值越小,表示是相应商品品目的概率越低,数值越大,表示是相应商品品目的概率越高。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于数采小博科技发展有限公司,未经数采小博科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211300861.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top