[发明专利]一种面向大规模语言模型的深度学习模型训练方法及系统在审
| 申请号: | 202310487657.4 | 申请日: | 2023-05-04 |
| 公开(公告)号: | CN116644794A | 公开(公告)日: | 2023-08-25 |
| 发明(设计)人: | 杨娟;王博;于政;翟士丹 | 申请(专利权)人: | 北京海致星图科技有限公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/0464;G06N3/0455 |
| 代理公司: | 成都鱼爪智云知识产权代理有限公司 51308 | 代理人: | 罗怡韵 |
| 地址: | 100083 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 大规模 语言 模型 深度 学习 训练 方法 系统 | ||
本发明提供一种面向大规模语言模型的深度学习模型训练方法及系统。所述面向大规模语言模型的深度学习模型训练方法,包括以下步骤:S1、将面向大规模语言模型的有关训练数据导入到文件服务器中,训练服务器中预安装训练环境;S2、在显示有控制界面的显示终端进行预测试,并得出预测试成绩。本发明提供的面向大规模语言模型的深度学习模型训练方法,在学习过程中,通过进行预测试,并根据预测试成绩,训练服务器能够从文件服务器中调用预先导入在所述文件服务器中的训练数据,生成对应的训练模型,从而对于有一些基础的而又没有学习数据的学者,能够使其快速对应学习,不仅提高了适用性,而且降低了学习语言的用时,从而提高了学习语言的效率。
技术领域
本发明涉及语言学习技术领域,尤其涉及一种面向大规模语言模型的深度学习模型训练方法及系统。
背景技术
深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本等数据。在语言学习时,也能够通过深度学习模型的训练流程,按照以往经验,一个深度学习模型的训练流程包括经过以下步骤:编写代码,安装环境,本地试运行,服务器运行,服务器代码调参,跟踪训练结果。
目前的深度学习模型的训练方式一般是从头学习或根据以往的学习数据来适配学习内容,但是对于有一些有学习基础而又没有学习数据的学生,导致其无法快速适配对应的学习内容进行学习,不仅适用性差,而且学习语言的效率低。
因此,有必要提供一种新的面向大规模语言模型的深度学习模型训练方法及系统解决上述技术问题。
发明内容
为解决上述技术问题,本发明提供一种面向大规模语言模型的深度学习模型训练方法及系统,在学习过程中,通过进行预测试,并根据预测试成绩,训练服务器能够从文件服务器中调用预先导入在所述文件服务器中的训练数据,生成对应的训练模型,从而对于有一些基础的而又没有学习数据的学者,能够使其快速对应学习,不仅提高了适用性,而且降低了学习语言的用时,从而提高了学习语言的效率。
本发明提供的面向大规模语言模型的深度学习模型训练方法及系统,包括以下步骤:
S1、将面向大规模语言模型的有关训练数据导入到文件服务器中,训练服务器中预安装训练环境;
S2、在显示有控制界面的显示终端进行预测试,并得出预测试成绩,预测试成绩通过消息队列接收的方式传入到所述训练服务器;
S3、根据得出的预测试成绩,训练服务器从文件服务器中调用预先导入在所述文件服务器中的训练数据,生成对应的训练模型,在进行显示终端进行训练;
S4、训练完成后,在显示终端对训练成果进行测试,得出测试成绩,并判断是否合格,不合格则重新进行训练。
需要说明的是:本发明在使用时,由于训练服务器中预安装有训练环境,从而在深度学习时,只需要将面向大规模语言模型的有关训练数据导入到文件服务器中即刻利用显示终端进行训练,不需要安装和部署环境,相比原有的部署方式,大大提高了安装的效率,在学习过程中,通过进行预测试,并根据预测试成绩,训练服务器能够从文件服务器中调用预先导入在所述文件服务器中的训练数据,生成对应的训练模型,从而对于有一些基础的而又没有学习数据的学者,能够使其快速对应学习,不仅提高了适用性,而且提高了学习语言的效率,而通过训练后的测试,能够很好的检测学习的情况,未能通过检测则无法进行后续的学习,需重新学习再测试,通过后才能进行后续的学习,从而能够保证学者学习通过。
在发明提供的面向大规模语言模型的深度学习模型训练方法中,所述深度学习模型训练过程所产生的训练数据储存在所述文件服务器中。
在发明提供的面向大规模语言模型的深度学习模型训练方法中,所述文件服务器通过所述控制界面显示所述训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海致星图科技有限公司,未经北京海致星图科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310487657.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高精度电网无人机巡检图像缺陷识别方法及系统
- 下一篇:微孔透气膜复合面料





