[发明专利]端到端模型训练方法、语义理解方法、装置、设备和介质在审
申请号: | 202210408734.8 | 申请日: | 2022-04-19 |
公开(公告)号: | CN114781365A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 张桐桐;殷腾龙 | 申请(专利权)人: | 海信视像科技股份有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/30 |
代理公司: | 北京国之大铭知识产权代理事务所(普通合伙) 11565 | 代理人: | 张平 |
地址: | 266555 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 端到端 模型 训练 方法 语义 理解 装置 设备 介质 | ||
本公开涉及一种端到端模型训练方法、语义理解方法、装置、设备和介质;其中,该方法包括:获取训练样本,训练样本包括自然语言文本、自然语言文本对应的关键词集合以及关键词对应的标签信息集合;定义端到端语义理解模型的框架,基于端到端语义理解模型的框架和训练样本,生成对应的语义理解结果,语义理解结果包括意图识别结果、关键词以及每个关键词对应的标签信息;基于预设损失函数,根据训练样本对端到端语义理解模型的框架进行训练,得到端到端语义理解模型。本公开实施例通过训练样本对端到端语义理解模型的框架进行端到端训练,得到端到端语义理解模型,使得语义理解更准确,减少误差的积累,且有利于提高领域对话理解的准确性。
技术领域
本公开涉及计算机领域和自然语言处理领域,尤其涉及一种端到端模型训练方法、语义理解方法、装置、设备和介质。
背景技术
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,能实现人与计算机之间用自然语言进行有效通信。语义理解是自然语言处理中的重要任务,也是实现智能交互的核心。其主要目的是通过自然语言处理相关技术,识别并标注出用户的音频数据所对应的意图及关键词语的槽位信息。但是,由于中文语义的多样性、文字词语的灵活性以及汉语语言的复杂性等,现有技术中语义理解不够准确,使得用户体验不佳。
发明内容
为了解决上述技术问题,本公开提供了一种端到端模型训练方法、语义理解方法、装置、设备和介质。
第一方面,本公开提供了一种端到端语义理解模型训练方法,该方法包括:
获取训练样本,所述训练样本包括自然语言文本、所述自然语言文本对应的关键词集合以及关键词对应的标签信息集合;
定义端到端语义理解模型的框架,基于所述端到端语义理解模型的框架和所述训练样本,生成对应的语义理解结果,所述语义理解结果包括意图识别结果、关键词以及每个关键词对应的标签信息;
基于预设损失函数,根据所述训练样本对所述端到端语义理解模型的框架进行训练,得到端到端语义理解模型。
作为本公开实施例一种可选的实施方式,所述端到端语义理解模型的框架包括语义特征提取单元、全连接层以及目标结果分数计算单元;
所述语义特征提取单元用于基于所述自然语言文本生成对应的语义向量;
所述全连接层用于对所述语义向量进行融合处理,得到意图识别预测向量和关键词预测向量;
所述目标结果分数计算单元用于基于所述意图识别预测向量和所述关键词预测向量分别得到对应的预测分数,并基于所述预测分数确定所述自然语言文本对应的语义理解结果。
作为本公开实施例一种可选的实施方式,所述基于所述意图识别预测向量和所述关键词预测向量分别得到对应的预测分数,并基于所述预测分数确定所述自然语言文本对应的语义理解结果,包括:
基于所述意图识别预测向量,根据第一参数矩阵,确定对应的第一预测分数;
基于所述关键词预测向量,根据第二参数矩阵,确定对应的第二预测分数;
基于所述意图识别预测向量和所述关键词预测向量,根据第三参数矩阵,确定对应的第三预测分数;
基于所述第一预测分数、所述第二预测分数以及所述第三预测分数,确定所述自然语言文本对应的语义理解结果。
作为本公开实施例一种可选的实施方式,所述语义特征提取单元包括:语义表示层和编码层;
所述语义表示层,用于基于所述自然语言文本生成对应的表示向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信视像科技股份有限公司,未经海信视像科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210408734.8/2.html,转载请声明来源钻瓜专利网。