[发明专利]一种面向大规模语言模型的深度学习模型训练方法及系统在审
| 申请号: | 202310487657.4 | 申请日: | 2023-05-04 |
| 公开(公告)号: | CN116644794A | 公开(公告)日: | 2023-08-25 |
| 发明(设计)人: | 杨娟;王博;于政;翟士丹 | 申请(专利权)人: | 北京海致星图科技有限公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/0464;G06N3/0455 |
| 代理公司: | 成都鱼爪智云知识产权代理有限公司 51308 | 代理人: | 罗怡韵 |
| 地址: | 100083 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 大规模 语言 模型 深度 学习 训练 方法 系统 | ||
1.一种面向大规模语言模型的深度学习模型训练方法,其特征在于,包括以下步骤:
S1、将面向大规模语言模型的有关训练数据导入到文件服务器中,训练服务器中预安装训练环境;
S2、在显示有控制界面的显示终端显示对应语言学习的预置试题,进行预测试,并得出预测试成绩,预测试成绩通过消息队列接收的方式传入到所述训练服务器;
S3、根据得出的预测试成绩对应成绩划分等级,训练服务器从文件服务器中调用预先导入在所述文件服务器中的训练数据,生成对应等级的预置训练模型,在显示终端进行训练;
S4、训练完成后,在显示终端对训练成果进行测试,得出测试成绩,并判断是否合格,不合格则重新进行训练。
2.根据权利要求1所述的面向大规模语言模型的深度学习模型训练方法及系统,其特征在于,所述深度学习模型训练过程所产生的训练数据储存在所述文件服务器中。
3.根据权利要求2所述的面向大规模语言模型的深度学习模型训练方法及系统,其特征在于,所述文件服务器通过所述控制界面显示所述训练数据。
4.根据权利要求1所述的面向大规模语言模型的深度学习模型训练方法及系统,其特征在于,所述控制界面还包括训练参数调整选项,调整参数通过消息队列接收的方式传入到所述训练服务器,根据消息,训练服务器从文件服务器中调用预先导入在所述文件服务器中的训练数据,生成对应的训练模型,在进行显示终端进行训练。
5.根据权利要求1所述的面向大规模语言模型的深度学习模型训练方法及系统,其特征在于,所述训练模型的生成采用卷积神经网络模型、深度信念网络模型、深度玻尔兹曼机模型或堆叠自动编码器模型,预置试题为事先指定的。
6.根据权利要求4所述的面向大规模语言模型的深度学习模型训练方法及系统,其特征在于,所述训练参数调整选项包括学习速率调整选项和迭代次数选项。
7.根据权利要求1所述的面向大规模语言模型的深度学习模型训练方法及系统,其特征在于,预安装的所述训练环境中已提供相关的依赖组件或软件。
8.一种面向大规模语言模型的深度学习模型系统,其特征在于,包括训练服务器、文件服务器和显示终端,训练服务器分别与文件服务器和显示终端连接,显示终端和文件服务器连接。
9.根据权利要求8所述的面向大规模语言模型的深度学习模型系统,其特征在于,所述训练服务器内预安装有训练环境,文件服务器存储有训练数据,显示终端显示有控制界面。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海致星图科技有限公司,未经北京海致星图科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310487657.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高精度电网无人机巡检图像缺陷识别方法及系统
- 下一篇:微孔透气膜复合面料





