“林晓钿”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果11个，建议您升级VIP下载更多相关专利

[发明专利]一种语法纠错模型的训练方法、装置、设备及存储介质-CN202210560454.9有效
发明人：蒋盛益;林楠铠;林晓钿;武洪艳 -专利权人：广东外语外贸大学
申请日： 2022-05-23 - 公布日： 2023-05-05 - 主分类号： G06F40/253 文献下载
摘要：本发明公开一种语法纠错模型的训练方法、装置、设备及存储介质，基于Transformer构建原始模型；在每一轮训练中，将预先获取的训练集输入到所述原始模型，并结合滑动平均策略，对所述原始模型中的参数进行调整；其中，所述训练集包括若干训练样本，所述训练样本包括由若干词语组成的原始句子、与所述原始句子对应的由若干标签组成的目标句子，所述目标句子预先由所述原始句子进行语法纠错得到；当训练轮次达到预设的次数阈值时，结束算法并以最后一轮训练得到的原始模型作为最优语法纠错模型。本发明实施例能够通过利用Transformer构建原始模型，结合滑动平均策略，利用预先获取的训练集进行模型训练，获得最优语法纠错模型，避免了过拟合以及提高了模型的泛化能力。
一种语法纠错模型训练方法装置设备存储介质

[发明专利]一种中文拼写纠错方法、装置、设备及存储介质-CN202210504740.3有效
发明人：蒋盛益;林楠铠;林晓钿;武洪艳;甘诚韬;杨子渝 -专利权人：广东外语外贸大学
申请日： 2022-05-10 - 公布日： 2023-04-07 - 主分类号： G06F40/232 文献下载
摘要：本发明公开了一种中文拼写纠错方法、装置、设备及存储介质，该方法包括：获取中文文本训练序列；将中文文本训练序列输入至语义表征模型中进行语义特征提取，以得到每个所述汉字的字向量表示；将每个汉字的字向量表示输入至预先构建的反向对比学习模型中，对相同汉语拼音的不同汉字进行对比学习，得到反向对比损失；基于反向对比损失对预先构建的中文拼写纠错模型的损失函数进行优化，得到优化后的中文拼写纠错模型；通过语义表征模型和优化后的中文拼写纠错模型对待检测的中文文本序列进行检测，得到修正后的中文文本序列。本发明能够提高中文拼写纠错模型对于同音异形字的区分能力，以解决现有的中文拼写纠错方法容易混淆同音异形字的问题。
一种中文拼写纠错方法装置设备存储介质

[发明专利]一种汉语语法纠错的评估方法、装置、设备及存储介质-CN202210443576.X有效
发明人：蒋盛益;林楠铠;林晓钿;武洪艳 -专利权人：广东外语外贸大学
申请日： 2022-04-26 - 公布日： 2023-03-28 - 主分类号： G06F40/226 文献下载
摘要：本发明公开了一种汉语语法纠错的评估方法、装置、设备及存储介质，包括：对原始汉语语法纠错评估语料库的测试集进行标注，得到扩充测试集；将每一修正句子分别与所有黄金标准注释进行匹配，计算得到基于句子级别的准确率；其中，修正句子为原始句子利用待评估汉语语法纠错模型进行修正后得到的句子；对每一修正句子利用BLEU算法，计算得到基于字级别的BLEU值；将每一修正句子分别与对应的原始句子进行匹配，计算得到基于字级别的修改度；根据基于句子级别的准确率、基于字级别的BLEU值和基于字级别的修改度对待评估汉语语法纠错模型进行评估。采用本发明实施例能够科学、全面、客观地评价汉语语法纠错模型的纠错效果。
一种汉语语法纠错评估方法装置设备存储介质

[发明专利]印尼语的情感分类方法、装置、设备及介质-CN202010402298.4有效
发明人：林楠铠;蒋盛益;林晓钿 -专利权人：广东外语外贸大学
申请日： 2020-05-13 - 公布日： 2023-03-28 - 主分类号： G06F40/211 文献下载
摘要：本发明公开了一种印尼语的情感分类方法，其特征在于，包括：获取待处理的印尼语句子，并确定所述待处理的印尼语句子对应的领域描述符；根据预设的CNN‑BILSTM模型对所述待处理的印尼语句子进行计算，得到所述待处理的印尼语句子对应的通用表示信息；根据所述领域描述符以及所述通用表示信息计算得到领域通用表示信息；将所述领域通用表示信息在当前领域对应的记忆网络样本库中进行加权计算，得到文本特征信息；根据所述文本特征信息确定对应的情感分类结果。本发明实施例还公开了一种印尼语的情感分类装置、设备及介质，使得在多个领域都可对印尼语进行情感分类。
印尼情感分类方法装置设备介质

[发明专利]样本选择方法、装置、设备及介质-CN202211606921.3在审
发明人：蒋盛益;林晓钿;林楠铠;付颖雯;杨子渝 -专利权人：广东外语外贸大学
申请日： 2022-12-14 - 公布日： 2023-03-24 - 主分类号： G06F18/211 文献下载
摘要：本发明公开一种样本选择方法、装置、设备及介质，所述方法通过分类数据增强策略生成的干净样本和噪声样本，并在干净样本中筛选高置信度的样本作为高质量样本，在噪声样本和置信度低的干净样本这类低可信度样本中进行再选择，以在高置信度的干净样本中补充高质量的低可信度样本，从而完成对增强样本中高质量样本的筛选。本发明不仅能有效筛选数据增强样本中生成的高质量样本，还增加了数据增强样本的多样性，使模型可以学到更多的模式，以提高模型的性能，从而进一步提高模型的泛化性。相应地，本发明还提供一种样本选择装置、设备及介质。
样本选择方法装置设备介质

[发明专利]多语种文本分类方法、装置、设备及介质-CN202211607728.1在审
发明人：蒋盛益;林晓钿;林楠铠;付颖雯;杨子渝 -专利权人：广东外语外贸大学
申请日： 2022-12-14 - 公布日： 2023-03-10 - 主分类号： G06F16/35 文献下载
摘要：本发明公开一种多语种文本分类方法、装置、设备及介质，所述方法通过获取目标文本和预先训练的学习模型，学习模型包括共享特征提取网络和多个子任务识别网络；通过所述共享特征提取网络得到目标文本的句向量表示和语种识别预测结果，并根据语种识别预测结果，调用对应语种的子任务识别网络对所述句向量表示模块进行处理，得到目标文本的分类结果，其中，所述子任务识别网络中的语种自学习模块通过对对应语种进行多个语种之间的相关性学习。本发明能将多个语种的语言之间的相关性知识融入模型中学习，并通过模型对多语种文本进行分类，从而更好地对多语种文本进行分类。相应地，本发明实施例还提供一种多语种文本分类装置、设备及介质。
语种文本分类方法装置设备介质

[发明专利]一种命名实体识别方法、装置、设备及存储介质-CN202211299349.0在审
发明人：蒋盛益;付颖雯;林楠铠;林晓钿;杨子渝 -专利权人：广东外语外贸大学
申请日： 2022-10-20 - 公布日： 2023-02-24 - 主分类号： G06F40/295 文献下载
摘要：本发明公开一种命名实体识别方法、装置、设备及存储介质，方法包括：基于教师模型损失函数和命名实体标注数据集对预训练的语言模型进行判别辅助任务训练，获得教师模型；利用教师模型过滤命名实体无监督样本集中存在错误预测标签的伪样本，获得第一样本集，并移除第一样本集中具有非实体标签的伪样本，获得第二样本集；然后生成第二样本集中每个伪样本所对应的伪标签，计算每个伪样本的置信度，选取置信度大于预设阈值的若干置信伪样本，并基于学生模型损失函数和命名实体标注数据集重新对预训练的语言模型进行训练，获得学生模型，以对输入的文本数据进行命名实体识别。本发明能够避免半监督学习模型在自训练过程中选择具有错误伪标签的伪样本。
一种命名实体识别方法装置设备存储介质

[发明专利]文本分类模型训练方法、文本分类方法、设备和介质-CN202110332411.0有效
发明人：王连喜;林楠铠;林晓钿;蒋越 -专利权人：广东外语外贸大学
申请日： 2021-03-29 - 公布日： 2023-02-10 - 主分类号： G06F16/35 文献下载
摘要：本发明公开了一种文本分类模型训练方法、文本分类方法、设备和介质，可应用于文本分类技术领域。训练方法包括以下步骤：获取第一训练数据，所述第一训练数据包括带标签的文本数据；采用所述第一训练数据对第一文本分类模型进行训练，得到第二文本分类模型；获取第二训练数据，所述第二训练数据包括不带标签的文本数据；采用所述第二文本分类模型预测所述第二训练数据的若干个标签；将若干个所述标签中满足预设要求的标签作为所述第二训练数据的伪标签；采用带有伪标签的第二训练数据和所述第一训练数据对所述第二文本分类模型进行训练，得到目标文本分类模型。本发明能节省标签标注时间和人工成本，并有效提高多标签分类结果的准确性。
文本分类模型训练方法设备介质

[发明专利]跨语言命名实体识别模型训练方法、装置及存储介质-CN202211354575.4在审
发明人：蒋盛益;付颖雯;林楠铠;林晓钿;杨子渝 -专利权人：广东外语外贸大学
申请日： 2022-11-01 - 公布日： 2023-01-06 - 主分类号： G06F40/295 文献下载
摘要：本发明公开一种跨语言命名实体识别模型训练方法、装置及存储介质。构建原始的跨语言命名实体识别模型，模型包括源分支模块、目标分支模块和优化模块；根据预先获取的源语言的监督数据对源分支模块进行训练，根据预先获取的目标语言的弱监督数据对目标分支模块进行训练；基于自蒸馏机制，根据目标语言的无标注数据对源分支模块和目标分支模块进行优化，得到最终的跨语言命名实体识别模型。本发明实施例能够通过构建包括源分支模块、目标分支模块和优化模块的模型，以源语言的监督数据、目标语言的弱监督数据、目标语言的无标注数据作为训练样本来进行模型训练，适用于低资源语言，无需建立明确的约束且适用于非同源语言的命名实体识别。
语言命名实体识别模型训练方法装置存储介质

[发明专利]一种短语语料库的构建方法、装置、设备和存储介质-CN202110984108.9在审
发明人：蒋盛益;林晓钿;林楠铠 -专利权人：广东外语外贸大学
申请日： 2021-08-25 - 公布日： 2021-12-24 - 主分类号： G06F40/253 文献下载
摘要：本发明公开了一种短语语料库的构建方法，包括：获取若干高质量短语和词性标注语料库；基于词性标注语料库，根据高质量短语生成短语模式对；其中，短语模式对包括高质量短语，以及与高质量短语对应的初始短语模式；基于词性标注语料库，根据初始短语模式，生成与初始短语模式对应的初始短语；根据初始短语，构建短语语料库。本发明还公开了一种短语语料库的构建装置、设备和存储介质，其能够根据获取的高质量短语和词性标注语料库，得到短语模式，进而根据短语模式和词性标注语料库，获得初始短语，以构建短语语料库，削弱了现有的规则制定所带来的主观性影响，适用于多种语言的短语语料库的快速构建。
一种短语语料库构建方法装置设备存储介质

[发明专利]多标签情绪分类模型的处理方法、系统和存储介质-CN202110793238.4在审
发明人：王连喜;林楠铠;向杰益;林晓钿 -专利权人：广东外语外贸大学
申请日： 2021-07-13 - 公布日： 2021-11-16 - 主分类号： G06K9/62 文献下载
摘要：本发明公开了一种多标签情绪分类模型的处理方法、系统和存储介质，可应用于深度学习技术领域。本发明方法涉及的分类模型包括通用表示模块、情绪表示模块、对抗分类器模块和情感判断模块，基于该模型的方法包括以下步骤：采用通用表示模块捕获文本的通用文本表示；采用对抗分类器模块增强通用文本表示；采用情绪表示模块获取不同情绪标签的情绪关联信息；根据增强后的通用文本表示和情绪关联信息，采用情绪表示模块获取文本的关键情感信息；采用情感判断模块根据关键情感信息判断文本表示的情绪类型。本发明通过获取不同情绪标签的情绪关联信息，并通过对抗训练模块增强通用文本表示，以提高情绪分类结果的准确性。
标签情绪分类模型处理方法系统存储介质

1
共 11 条