[发明专利]货运语料意图分类模型的训练方法、装置、设备及介质在审
申请号: | 202211295204.3 | 申请日: | 2022-10-21 |
公开(公告)号: | CN115687584A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 闫晚丰;张治宇;蒋志强;周炜星;杨毓丞 | 申请(专利权)人: | 上海运柚科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/289;G06F40/30;G06N3/0464;G06N3/08 |
代理公司: | 广东京大方元专利代理有限公司 44872 | 代理人: | 徐莉娜 |
地址: | 200082 上海市杨浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 货运 语料 意图 分类 模型 训练 方法 装置 设备 介质 | ||
本申请涉及人工智能领域,公开了一种货运语料意图分类模型的训练方法、装置、设备及存储介质。该方法包括:获取货运语料训练集,货运语料训练集中包括多条货运语料样本及其意图类别;根据每条货运语料样本的意图类别,对每条货运语料样本进行数据标注;预处理每条货运语料样本,得到多条目标货运语料样本;对每条目标货运语料样本执行向量表达,得到每条目标货运语料样本的初始句向量;构建TextCNN网络模型,并初始化网络参数;依次将每个初始句向量输入至TextCNN网络模型中执行多分类训练,得到货运语料意图分类模型。本发明通过训练货运语料意图分类模型,进而使用货运语料意图分类模型识别各中货运语料的意图,提升了货运语料意图识别的效率。
技术领域
本申请涉及人工智能领域,尤其涉及一种货运语料的意图分类方法、装置、设备及存储介质。
背景技术
在货运场景中,很多人机交互、人与人交互的货运语料被予以记录,通过分析货运语料可以识别货运语料对应的意图,进而根据所识别意图做进一步决策。
在现有的技术中,对于货运场景下的货运语料通常是由人为判断意图,进而根据其意图做出决策或答复,其效率低下。
申请内容
本申请实施例提供一种货运语料意图分类模型的训练方法,能够对货运场景的中货运语料样本执行预训练,并在预训练的基础上执行意图分类训练,从而得到货运语料意图分类模型,进而可使用货运语料意图分类模型识别各中货运语料的意图,提升了货运语料意图识别的效率。
第一方面,本申请实施例提供一种货运语料意图分类模型的训练方法,包括:响应于接收到模型训练请求,获取预置的货运语料训练集,其中,货运语料训练集中包括多条货运语料样本和每条货运语料样本对应的意图类别;根据每条货运语料样本对应的意图类别,对每条货运语料样本进行数据标注;对货运语料训练集中的每条货运语料样本执行预处理,得到多条目标货运语料样本;对每条目标货运语料样本执行向量表达,得到每条目标货运语料样本对应的初始句向量;构建TextCNN网络模型,并初始化TextCNN网络模型的网络参数;依次将每条目标货运语料样本对应的初始句向量输入至TextCNN网络模型中执行多分类训练,得到货运语料意图分类模型。
基于本申请实施例提供的方法,通过获取货运语料样本及其意图,根据意图为每条货运语料样本进行标注,预处理每条货运语料样本,将预处理后的每条货运语料样本转换为向量表示,构建并初始化TextCNN网络模型,最后基于每条货运语料样本的向量表示对该TextCNN网络模型执行多分类训练,从而得到强泛化能力的货运语料意图分类模型,能够识别货运场景中各种货运语料的意图类别。
在一种可能的实现方式中,对货运语料训练集中的每条货运语料样本执行预处理,得到多条目标货运语料样本包括:对货运语料训练集中的每条初始货运语料样本执行分词处理;去除分词处理后的每条初始货运语料样本中的停用词;对去除停用词后的每条初始货运语料样本进行词干提取,得到多条目标货运语料样本。
这样一来,分词处理可以将货运语料样本划分为多个分词,进而便于将其转换为多个词向量的叠加;去除停用词以及词干提取可以保留货运语料样本中的语义表示部分,去除不影响语义的部分(例如语气助词等),在保留语义的基础上尽可能减少样本的大小,从而提升模型的计算处理效率,进而提升货运语料意图分类模型的训练效率。
在一种可能的实现方式中,每条目标货运语料样本为一个分词序列,每个分词序列中至少包括一个分词,对每条目标货运语料样本执行向量表达,得到每条目标货运语料样本对应的初始句向量包括:获取与货运行业相关的词嵌套预训练模型,并将每条目标货运语料样本中的分词依次输入至词嵌套预训练模型中执行预训练,得到每条目标货运语料样本中各分词对应的词向量;基于同一目标货运语料样本中各分词对应的词向量求和后计算平均值,得到每条目标货运语料样本对应的初始句向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海运柚科技有限公司,未经上海运柚科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211295204.3/2.html,转载请声明来源钻瓜专利网。