[发明专利]基于可视化的代码识别模型训练方法及装置在审

申请号：	202011586098.5	申请日：	2020-12-28
公开（公告）号：	CN114691111A	公开（公告）日：	2022-07-01
发明（设计）人：	刘晓娟;李兆军;尹非凡	申请（专利权）人：	北京三快在线科技有限公司
主分类号：	G06F8/34	分类号：	G06F8/34;G06N20/00
代理公司：	北京润泽恒知识产权代理有限公司 11319	代理人：	任亚娟
地址：	100083 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于可视化代码识别模型训练方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开的实施例提供了一种基于可视化的代码识别模型训练方法及装置。所述方法包括：显示模型配置页面；获取用户在所述模型配置页面内输入的模型训练模式、模型网络结构和超参数；获取与所述模型网络结构匹配的待训练代码识别模型；根据所述模型训练模式，获取预先保存的所述待训练代码识别模型对应的代码训练样本；加载所述超参数，并根据所述代码训练样本对所述待训练代码识别模型进行训练。本公开的实施例可以节省大量的人力物力和时间，减少了代码开发量，节省了模型训练时间，提高了模型的训练效率。

技术领域

本公开的实施例涉及模型训练技术领域，尤其涉及一种基于可视化的代码识别模型训练方法及装置。

背景技术

深度学习已成为工业界智能化的发展趋势，广泛应用于外卖、配送、小象、单车、快驴等业务线。

深度学习的核心是在复杂的网络中找到最优模型，用于匹配数据，深度学习更关注于模型的设计，一个简单的改动或者一个结构的简单调整就能使得模型效果得到大幅的提升，灵活性、多样性的模型配置至关重要。而且超参数在深度学习模型训练中扮演着举足轻重的作用，超参数可用于控制算法行为。

目前，基于可视化深度学习模型组件的训练模式，算法平台提供主流的深度学习模型组件，用户在可视化界面通过拖拽的方式构建实验，不支持用户自定义网络结构。而基于自定义深度学习代码的模型训练模式，算法平台集成开源JupyterLab的形式，提供交互式编程环境，用户可在IDE中进行代码编写、调试及运行。

基于可视化深度学习模型组件的训练模式。平台对模型的输入输出类型及算法有约束，在预测性和规范性建模的问题类型和技术方面有较高的限制。用户只能用有限的深度学习算法做模型训练，无法自定义新的算法和网络结构。实验性地人工调整层的类型和数量、连接方式、节点和其它超参数较困难，灵活性较低。深度学习算法很复杂，普适性较差，无法用主流深度学习方法去覆盖复杂的业务场景。需要投入大量的人力、物力和时间来开发新的算法和模型。深度学习模型的自定义、适配性、输入输出的不确定性以及超参数的多样性，平台较难做定制化的适配。而基于自定义深度学习代码的模型训练模式。用户需要写完整的深度学习模型训练代码，自定义深度学习代码对使用者的能力要求高，门槛较高。相同功能的代码需要用户重复开发，代码开发量大，耗时较久，模型训练效率较低。

发明内容

本公开的实施例提供一种基于可视化的代码识别模型训练方法及装置，用以最大最大程度降低模型训练的限制、用户犯错成本，减少了人力成本和资源浪费，且无需用户开发代码，减少代码开发量，提高模型训练效率。

根据本公开的实施例的第一方面，提供了一种基于可视化的代码识别模型训练方法，包括：

显示模型配置页面；

获取用户在所述模型配置页面内输入的模型训练模式、模型网络结构和超参数；

获取与所述模型网络结构匹配的待训练代码识别模型；

根据所述模型训练模式，获取预先保存的所述待训练代码识别模型对应的代码训练样本；

加载所述超参数，并根据所述代码训练样本对所述待训练代码识别模型进行训练。

可选地，在所述加载所述超参数，并根据所述代码训练样本对所述待训练代码识别模型进行训练之前，还包括：

获取所述用户在所述模型配置页面内输入的模型输入参数和模型输出参数；

所述加载所述超参数，并根据所述代码训练样本对所述待训练代码识别模型进行训练，包括：

根据所述模型输入参数，将所述代码训练样本输入至所述待训练代码识别模型；