[发明专利]翻译模型的训练方法、装置、电子设备及存储介质在审
申请号: | 202310886208.7 | 申请日: | 2023-07-19 |
公开(公告)号: | CN116611459A | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 陈小帅 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F18/213;G06F18/214;G06F18/241;G06N3/0455;G06N3/0499;G06N3/044;G06N3/084 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 赵翠萍;王黎延 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译 模型 训练 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种翻译模型的训练方法、装置、电子设备及存储介质;方法包括:获取第一训练集,其中,第一训练集包括多个第一文本对,其中,第一文本对包括第一原始文本和第一翻译文本,且第一原始文本与第一翻译文本的情感限定一致;获取第一原始文本对应的音频数据,从第一原始文本对应的音频数据提取第一音频特征;获取第一原始文本的第一文本特征;基于第一原始文本的第一文本特征和第一音频特征调用翻译模型进行文本翻译处理,得到第一预测文本;基于第一预测文本和第一翻译文本确定翻译模型的第一预测损失;基于第一预测损失更新翻译模型的参数。通过本申请,能够提升翻译模型进行文本翻译的准确性。
技术领域
本申请涉及人工智能技术,尤其涉及一种翻译模型的训练方法、装置、电子设备及存储介质。
背景技术
人工智能(Artificial Intelligence, AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、预训练模型技术、操作/交互系统、机电一体化等。其中,预训练模型又称大模型、基础模型,经过微调后可以广泛应用于人工智能各大方向下游任务。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
相关技术中,可以通过人工智能方式将不同的语言翻译为其他类型的语言,例如:将中文翻译为英文。文本能够用于表达人类的感情,通过人工智能翻译得到的文本能够保留原始文本的含义,但难以表征原始文本所表达的感情,影响了翻译处理的准确性,进而影响了用户对文本内容的理解,影响了用户观看体验。相关技术中,暂无较好的方式能够提升翻译模型进行文本翻译的准确性。
发明内容
本申请实施例提供一种翻译模型的训练方法以及文本处理方法、装置、电子设备及计算机可读存储介质、计算机程序产品,能够提升翻译模型进行文本翻译的准确性。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种翻译模型的训练方法,所述方法包括:
获取第一训练集,其中,所述第一训练集包括多个第一文本对,其中,所述第一文本对包括第一原始文本和第一翻译文本,且所述第一原始文本与所述第一翻译文本的情感限定一致;
获取所述第一原始文本对应的音频数据,从所述第一原始文本对应的音频数据提取第一音频特征;
获取所述第一原始文本的第一文本特征;
基于所述第一原始文本的第一文本特征和所述第一音频特征调用所述翻译模型进行文本翻译处理,得到第一预测文本;
基于所述第一预测文本和所述第一翻译文本确定所述翻译模型的第一预测损失;
基于所述第一预测损失更新所述翻译模型的参数。
本申请实施例提供一种翻译模型的训练装置,包括:
第一数据获取模块,配置为获取第一训练集,其中,所述第一训练集包括多个第一文本对,其中,所述第一文本对包括第一原始文本和第一翻译文本,且所述第一原始文本与所述第一翻译文本的情感限定一致;
第一文本翻译模块,配置为获取所述第一原始文本对应的音频数据,从所述第一原始文本对应的音频数据提取第一音频特征;
所述第一文本翻译模块,配置为获取所述第一原始文本的第一文本特征;
所述第一文本翻译模块,配置为基于所述第一原始文本的第一文本特征和所述第一音频特征调用所述翻译模型进行文本翻译处理,得到第一预测文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310886208.7/2.html,转载请声明来源钻瓜专利网。