“暴宇健”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果61个，建议您升级VIP下载更多相关专利

[发明专利]一种代码生成与缺陷修复方法和装置-CN202311168557.1在审
发明人：徐琳;王芳;暴宇健 -专利权人：深圳须弥云图空间科技有限公司
申请日： 2023-09-12 - 公布日： 2023-10-20 - 主分类号： G06F8/30 文献下载
摘要：本申请涉及人工智能应用技术领域，提供了一种代码生成与缺陷修复方法和装置。该方法包括：构建有监督的代码生成语料库，以及基于代码生成语料库，对大语言模型进行预训练；输入代码生成需求和/或缺陷描述至经过预训练的大语言模型，以便对大语言模型进行微调后，获得生成代码和/或代码缺陷修复建议；依据代码编译器对生成代码的编译测试结果，采用强化学习类算法，对生成代码和/或代码缺陷修复建议进行评估，以便更新大语言模型的参数，直至模型收敛。本申请实施例的在对生成代码或者需要进行缺陷修复的代码进行修改或者修复时，能够有效检测评估代码缺陷以及代码缺陷修复准确性。
一种代码生成缺陷修复方法装置

[发明专利]一种任务型对话系统及其实现方法-CN202311168630.5在审
发明人：王芳;暴宇健 -专利权人：深圳须弥云图空间科技有限公司
申请日： 2023-09-12 - 公布日： 2023-10-20 - 主分类号： G06F40/30 文献下载
摘要：本申请涉及人机交互技术领域，提供了一种任务型对话系统及其实现方法。该系统至少包括关键信息提取模块、候选答案生成模块和答案输出模块；其中，关键信息提取模块，用于对目标问题进行语义理解，以及依据语义理解结果，获取目标问题的关键信息，关键信息至少包括关键词；候选答案生成模块，用于依据关键词，获取对应于目标问题的召回结果，以及基于召回结果，生成候选答案；答案输出模块，用于依据预设排序规则，对候选答案进行排序后，发送目标问题的最终答案至用户。本申请实施例的任务型对话系统基于大语言模型构建，无需提前形成知识库，能够有效提高用户问题与答案的匹配程度。
一种任务对话系统及其实现方法

[发明专利]强化学习模型的训练方法及装置-CN202311168598.0在审
发明人：杜梦雪;暴宇健 -专利权人：深圳须弥云图空间科技有限公司
申请日： 2023-09-12 - 公布日： 2023-10-20 - 主分类号： G06N3/092 文献下载
摘要：本公开涉及计算机技术领域，提供了一种强化学习模型的训练方法及装置。该方法包括：获取使用设定强化学习算法对第一强化学习模型进行训练得到的第二强化学习模型；将相同的训练数据分别输入到第一强化学习模型和第二强化学习模型，对应得到第一输出数据组和第二输出数据组；根据训练数据、第一输出数据组、第二输出数据组和设定的总损失函数获取总损失函数值，其中，总损失函数的自蒸馏损失函数部分根据第一输出数据组和第二输出数据组的距离得到；根据总损失函数值调整第一强化学习模型，直到第一强化学习模型收敛，得到训练好的目标强化学习模型。本公开的技术方案可以提高强化学习模型在实际应用中的泛化能力和可复现性。
强化学习模型训练方法装置

[发明专利]基于时间顺序的音频识别模型训练方法及装置-CN202310779759.3有效
发明人：董辉;暴宇健 -专利权人：深圳须弥云图空间科技有限公司
申请日： 2023-06-29 - 公布日： 2023-10-03 - 主分类号： G10L15/06 文献下载
摘要：本公开涉及机器学习技术领域，提供了一种基于时间顺序的音频识别模型训练方法及装置。该方法包括：利用卷积神经网络和池化层构建非线性编码网络，利用非线性编码网络、自注意力网络和N‑K个全连接神经网络构建音频表征模型，利用音频表征模型和自回归循环网络构建音频识别模型；冻结自回归循环网络的模型参数，对音频表征模型进行对比预测编码训练，以完成对音频识别模型的第一阶段训练；在完成第一阶段训练后，解冻自回归循环网络的模型参数，对音频识别模型进行语音识别训练，以完成对音频识别模型的第二阶段训练。采用上述技术手段，解决现有技术中，利用机器学习进行音频识别时无法考虑音频之间的时间关联的问题。
基于时间顺序音频识别模型训练方法装置

[发明专利]基于图像空间位置的图像表征模型训练方法及装置-CN202310779761.0有效
发明人：孙海亮;暴宇健 -专利权人：深圳须弥云图空间科技有限公司
申请日： 2023-06-29 - 公布日： 2023-10-03 - 主分类号： G06N3/0895 文献下载
摘要：本公开涉及机器学习技术领域，提供了一种基于图像空间位置的图像表征模型训练方法及装置。该方法包括：通过非线性编码网络确定每个小图像的低维向量表征，根据前K个小图像的低维向量表征，通过自回归网络确定前K个小图像的前后空间潜向量；将第K个小图像的前后空间潜向量分别经过N‑K个全连接神经网络，得到第K+1个小图像至第N个小图像的预测向量表征；根据第K+1个小图像至第N个小图像的低维向量表征和预测向量表征，计算自监督损失；根据前K个小图像以及前K个小图像的正样本和负样本的低维向量表征，计算对比学习损失；根据自监督损失和对比学习损失更新图像表征模型的模型参数，以完成对图像表征模型的训练。
基于图像空间位置表征模型训练方法装置

[发明专利]作文生成模型训练方法及装置-CN202310876691.0有效
发明人：王芳;暴宇健 -专利权人：深圳须弥云图空间科技有限公司
申请日： 2023-07-18 - 公布日： 2023-10-03 - 主分类号： G06F18/214 文献下载
摘要：本公开涉及机器学习技术领域，提供了一种作文生成模型训练方法及装置。该方法包括：获取第一训练数据集，基于第一训练数据集中的题目要求和该题目要求对应的作文，利用交叉熵损失函数对预训练语言模型进行训练；获取题目数据集，利用训练后的预训练语言模型为题目数据集中的题目要求多次生成对应的作文，根据题目数据集中的题目要求以及预训练语言模型生成的该题目要求对应的多篇作文构建第二训练数据集和第三训练数据集；基于第二训练数据集，利用三元组损失函数对题文距离衡量模型进行训练；基于第三训练数据集，利用策略梯度函数对训练后的预训练语言模型进行再训练，将再训练后的预训练语言模型作为作文生成模型。
作文生成模型训练方法装置

[发明专利]应用于角色扮演推理类游戏的大语言模型的训练方法-CN202310884926.0有效
发明人：汪骞;暴宇健;王芳 -专利权人：深圳须弥云图空间科技有限公司
申请日： 2023-07-19 - 公布日： 2023-10-03 - 主分类号： A63F13/822 文献下载
摘要：本申请涉及虚拟游戏技术领域，提供了一种应用于角色扮演推理类游戏的大语言模型的训练方法。该方法包括：获取目标游戏的训练数据，并生成进行上下文字级别训练的第一自回归语言任务和进行上下文句级别训练的第二自回归语言任务，其中，目标游戏为角色扮演推理类；依据第一自回归语言任务，利用训练数据对大语言模型进行上下文字级别训练；依据第二自回归语言任务，利用训练数据对上下文字级别训练后的大语言模型进行上下文句级别训练；利用上下文字级别训练后的大语言模型在目标游戏为各个用户提供服务，收集各个用户对大语言模型提供服务的反馈，依据各个用户对大语言模型提供服务的反馈对大语言模型进行强化学习训练。
应用于角色扮演推理游戏语言模型训练方法

[发明专利]利用噪声扰动训练预训练语言模型的方法及装置-CN202310614779.5有效
发明人：吴亚军;暴宇健;王芳;徐琳 -专利权人：深圳须弥云图空间科技有限公司
申请日： 2023-05-29 - 公布日： 2023-09-26 - 主分类号： G06N20/00 文献下载
摘要：本申请涉及机器学习技术领域，提供了一种利用噪声扰动训练预训练语言模型的方法及装置。该方法包括：获取目标任务对应的训练数据集和预训练语言模型；计算预训练语言模型中每个参数矩阵对应的噪声扰动，并根据每个参数矩阵对应的噪声扰动更新该参数矩阵；基于目标任务，利用训练数据集优化预训练语言模型中的偏置项和更新后的参数矩阵。采用上述技术手段，解决现有技术中，对预训练好的大规模模型进一步训练，最终得到的模型往往存在过拟合以及泛化能力低的问题。
利用噪声扰动训练语言模型方法装置

[发明专利]模型旁路调优方法及装置-CN202310619452.7在审
发明人： 暴宇健;汪骞 -专利权人：北京龙智数科科技服务有限公司
申请日： 2023-05-29 - 公布日： 2023-09-12 - 主分类号： G06F16/35 文献下载
摘要：本公开涉及机器学习技术领域，提供了一种模型旁路调优方法及装置。该方法包括：确定用于执行目标任务的大规模目标模型所对应的小规模目标模型，其中，小规模目标模型和大规模目标模型为目标模型的不同版本，小规模目标模型的模型规模小于大规模目标模型的模型规模；利用小规模目标模型和大规模目标模型构建双路目标模型，其中，小规模目标模型为双路目标模型的旁支网络，大规模目标模型为双路目标模型的主支网络；对双路目标模型进行训练：冻结双路目标模型中大规模目标模型的模型参数，对双路目标模型中小规模目标模型进行训练；利用训练后的双路目标模型执行目标任务。
模型旁路方法装置

[发明专利]表格机器学习模型训练方法、装置、电子设备及存储介质-CN202310936986.2在审
发明人：孙海亮;暴宇健 -专利权人：深圳须弥云图空间科技有限公司
申请日： 2023-07-28 - 公布日： 2023-08-29 - 主分类号： G06F40/18 文献下载
摘要：本申请提供一种表格机器学习模型训练方法、装置、电子设备及存储介质。该方法包括：利用预定的特征类型对应的特征嵌入方法对字段执行特征嵌入操作，得到标准嵌入矩阵；将标准嵌入矩阵输入到表格机器学习模型的自注意力层中进行训练；将正样本的同一维度下的特征嵌入向量进行三元组损失计算，得到垂直对比损失，将同一样本内的特征嵌入向量进行三元组损失计算，得到水平对比损失；将垂直对比损失与水平对比损失进行加权求和，得到表格机器学习模型的总体对比损失，利用总体对比损失反向传播更新表格机器学习模型的参数，直至表格机器学习模型收敛。本申请能够灵活的学习表格数据，模型训练过程简单，容易复用，可进行对比学习和迁移学习。
表格机器学习模型训练方法装置电子设备存储介质

[发明专利]基于对文本进行破坏处理的文本数据增强方法及装置-CN202310364625.5有效
发明人：徐琳;王芳;暴宇健 -专利权人：北京龙智数科科技服务有限公司
申请日： 2023-04-07 - 公布日： 2023-08-29 - 主分类号： G06F40/151 文献下载
摘要：本公开涉及文本处理技术领域，提供了一种基于对文本进行破坏处理的文本数据增强方法及装置。该方法包括：构建文本扩散模型，其中，文本扩散模型包括前向模块和反向模块，前向模块是根据多种破坏处理构建的，反向模块是进行模型训练得到的，前向模块和反向模块实现相反的操作；利用文本扩散模型的前向模块将文本数据集中的原始文本转换为文本向量，并通过对文本向量连续多次进行破坏处理，得到原始文本对应的破坏向量；利用文本扩散模型的反向模块对破坏向量连续多次进行恢复处理，得到原始文本对应的还原向量，并将还原向量转换为文本格式，得到原始文本对应的还原文本；利用原始文本和还原文本生成数据增强后的文本数据集。
基于文本进行破坏处理数据增强方法装置

[发明专利]图像分类方法及装置-CN202310416399.0有效
发明人：王芳;暴宇健 -专利权人：深圳须弥云图空间科技有限公司
申请日： 2023-04-19 - 公布日： 2023-08-29 - 主分类号： G06V10/764 文献下载
摘要：本公开涉及计算机技术领域，提供了一种图像分类方法及装置。该方法包括：获取待分类图像；将待分类图像输入到预置的图像分类模型，采用图像分类模型对待分类图像进行分类，得到分类结果，其中，图像分类模型采用训练图片、初始分类模型、第一损失函数和第二损失函数训练得到，第一损失函数根据第一任务数据构建，第一任务数据为对进行随机掩码处理后的分片执行对比学习任务的任务数据，第二损失函数根据第二任务数据构建，第二任务数据为对进行随机掩码处理后的分片输入初始分类模型执行掩码图像还原任务的任务数据。本公开的技术方案可以提高图像分类模型的图像分类的精度。
图像分类方法装置

[发明专利]多阶段训练文本标题生成模型的方法及装置-CN202310443810.3有效
发明人：王芳;暴宇健 -专利权人：北京龙智数科科技服务有限公司
申请日： 2023-04-24 - 公布日： 2023-08-29 - 主分类号： G06F40/258 文献下载
摘要：本公开涉及机器学习技术领域，提供了一种多阶段训练文本标题生成模型的方法及装置。该方法包括：获取第一训练数据集，利用第一训练数据集对文本标题生成模型进行第一阶段训练；获取第一文本数据集，利用第一阶段训练后的文本标题生成模型为第一文本数据集中的文本生成标题，根据第一文本数据集中的文本以及该文本对应的标题生成第二训练数据集；利用第二训练数据集对标题打分模型进行训练；获取第二文本数据集，利用第二文本数据集和训练后的标题打分模型对第一阶段训练后的文本标题生成模型进行第二阶段训练。采用上述技术手段，解决现有技术中，生成的文本标题不通顺以及语义不连贯的问题。
阶段训练文本标题生成模型方法装置

[发明专利]基于CTR预测模型的目标推荐方法及装置-CN202310457563.2有效
发明人：董辉;暴宇健 -专利权人：北京龙智数科科技服务有限公司
申请日： 2023-04-26 - 公布日： 2023-08-29 - 主分类号： G06Q30/0601 文献下载
摘要：本公开涉及机器学习技术领域，提供了一种基于CTR预测模型的目标推荐方法及装置。该方法包括：利用卷积层、池化层和全连接层构建多组特征生成层，并利用嵌入层和多组特征生成层构建特征生成网络，其中，多组特征生成层彼此使用的卷积核不同；利用特征拼接层、特征组合层、多层感知机和softmax层构建特征分类网络；利用特征生成网络和特征分类网络构建CTR预测模型；依据推荐任务对CTR预测模型进行训练，利用训练后的CTR预测模型执行推荐任务。采用上述技术手段，解决现有技术中，CTR预测中特征交互比较少，比较稀疏，导致CTR预测准确率低的问题。
基于 ctr 预测模型目标推荐方法装置

[发明专利]模型旁路调优方法及装置-CN202310615673.7在审
发明人： 暴宇健;汪骞;王灏 -专利权人：深圳须弥云图空间科技有限公司
申请日： 2023-05-29 - 公布日： 2023-08-22 - 主分类号： G06N3/084 文献下载
摘要：本公开涉及机器学习技术领域，提供了一种模型旁路调优方法及装置。该方法包括：构建目标模型的嵌入层和线性层各自对应的第一矩阵和第二矩阵；利用嵌入层对应的第一矩阵和第二矩阵构建嵌入层的第一旁路网络，利用线性层对应的第一矩阵和第二矩阵构建线性层的第二旁路网络；对构建第一旁路网络和第二旁路网络后的目标模型进行训练：冻结目标模型中除第一旁路网络和第二旁路网络之外的其它网络层的网络参数，对第一旁路网络和第二旁路网络进行训练；利用训练后的目标模型执行目标任务。采用上述技术手段，解决现有技术中，目标模型训练面临待调优参数量大和耗时长的问题。
模型旁路方法装置

1
2
3
4
5
下一页»
尾页
共 61 条