“林楠铠”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果26个，建议您升级VIP下载更多相关专利

[发明专利]一种伪标签数据构建方法、装置、终端及介质-CN202310919963.0在审
发明人：蒋盛益;武洪艳;林楠铠 -专利权人：广东外语外贸大学
申请日： 2023-07-25 - 公布日： 2023-10-27 - 主分类号： G06F40/30 文献下载
摘要：本发明公开了一种伪标签数据构建方法、装置、终端及介质，所述方法包括采用数据增强方法对原始数据集进行数据增强，得到所述原始数据集的增强样本；基于伪困惑度为每个所述增强样本生成高置信度的第一伪标签；通过标签数据训练的模型为每个所述增强样本生成高置信度的第二伪标签；保留所述第一伪标签和所述第二伪标签一致的伪标签数据，作为每个所述增强样本的伪标签，以进行中文语义错误识别。因此，本发明实施例能够分别基于困惑度和模型两种不同的策略为每个增强样本联合筛选高置信度的伪标签，保留由两种伪标签生成策略一致的伪标签数据进行中文语义错误识别，以提升语义错误识别模型的识别性能。
一种标签数据构建方法装置终端介质

[发明专利]一种语义错误识别方法、装置、终端及介质-CN202310923076.0在审
发明人：蒋盛益;武洪艳;林楠铠 -专利权人：广东外语外贸大学
申请日： 2023-07-25 - 公布日： 2023-10-27 - 主分类号： G06F40/30 文献下载
摘要：本发明公开了一种语义错误识别方法、装置、终端及介质，所述方法包括对文本的目标句子进行编码，得到目标句子的原始语义特征，提取文本的所有句子的依存句法信息，并生成相应的依存句法树，定义依存距离以构建距离矩阵，归一化得到编码句法树结构的相关度矩阵，通过注意力机制处理进而得到可学习的相关度矩阵，将依存句法信息融合到原始语义特征获得具有句法意识的第二语义特征，结合原始语义特征得到新语义特征，将新语义特征的特征向量输入线性分类器，得到所述目标句子的预测标签概率分布。因此，本发明实施例基于依存句法注意力机制融合句法信息的同时保留预训练知识，减少大量的算力和时间成本；同时进一步提升模型识别中文语义错误的效果。
一种语义错误识别方法装置终端介质

[发明专利]一种基于膨胀残差宽度网络的模态分析方法、系统及装置-CN202310896177.3在审
发明人：阳爱民;曾培健;陆茂华;侯利恒;林楠铠;林江豪 -专利权人：广东工业大学;广船国际有限公司
申请日： 2023-07-21 - 公布日： 2023-10-24 - 主分类号： G06N3/0464 文献下载
摘要：本发明公开了一种基于膨胀残差宽度网络的模态分析方法、系统及装置，该方法包括：收集多类别的模态分析案例，构建数据集；基于DRN网络框架，结合膨胀残差卷积模块和宽度学习模块，构建分析模型；设定损失函数，基于所述数据集对所述分析模型进行训练，得到训练完成的分析模型；将待测数据输入至所述训练完成的分析模型，得到模态分析结果。该系统包括：数据集构建模块、模型构建模块、模型训练模块和模态分析模块。该装置包括存储器以及用于执行上述基于膨胀残差宽度网络的模态分析方法的处理器。通过使用本发明，达到降低模态分析方法中模型计算时间开销的目的。本发明可广泛应用于模态分析领域。
一种基于膨胀宽度网络分析方法系统装置

[发明专利]一种用于多标签情感分类的训练方法、系统及装置-CN202310686650.5在审
发明人：阳爱民;林楠铠;曾培健;周栋 -专利权人：广东工业大学
申请日： 2023-06-09 - 公布日： 2023-08-22 - 主分类号： G06F18/2431 文献下载
摘要：本发明公开了一种用于多标签情感分类的训练方法、系统及装置，该方法包括：获取数据集并将数据集按类别划分样本；基于情感分类模型分别对不同类别的训练集进行识别；基于第一训练集对情感分类模型进行训练，采用多标签交叉熵损失函数计算损失并进行反向传播；基于第二训练集对情感分类模型进行训练，采用对比损失函数计算损失并进行反向传播。该系统包括：类别划分模块、初识别模块、第一训练模块和课程学习模块。该装置包括存储器以及用于执行上述多标签情感分类的训练方法的处理器。通过使用本发明，能够保证模型在充分学习简单样本信息的同时，聚焦于困难样本。本发明可广泛应用于分类模型训练领域。
一种用于标签情感分类训练方法系统装置

[发明专利]马来语识别模型的训练方法、识别方法、装置、设备-CN202010393898.9有效
发明人：付颖雯;林楠铠;蒋盛益 -专利权人：广东外语外贸大学
申请日： 2020-05-11 - 公布日： 2023-08-22 - 主分类号： G06F40/279 文献下载
摘要：本发明公开了一种马来语识别模型的训练方法，包括：从预设的马来语数据库中获取至少一个待训练的马来语句子；其中，词性不同的同一单词应用于所述待训练的马来语句子；根据预设的马来语信息提取模型获取所述待训练的马来语句子对应的语义信息；其中，所述语义信息包括词向量特征信息以及文本特征信息；根据预设的Bi‑LSTM模型对所述语义信息进行编码；将编码后的语义信息分别输入至词性标注任务模块以及命名实体识别任务模块进行训练，获取训练完成的马来语识别模型。本发明实施例还提供了一种马来语的识别方法、装置、设备及介质，有效解决现有技术马来语识别的准确性较差的问题。
马来语识别模型训练方法装置设备

[发明专利]一种基于对比学习的多标签文本分类方法及系统-CN202310331077.6在审
发明人：阳爱民;林楠铠;黄仕桥 -专利权人：广东工业大学
申请日： 2023-03-30 - 公布日： 2023-07-18 - 主分类号： G06F16/35 文献下载
摘要：本发明公开了一种基于对比学习的多标签文本分类方法及系统，方法包括S1：获取多标签文本和每个多标签文本对应的类别标签，S2：根据所述词向量采用多标签文本分类模型对训练集多标签文本进行编码，得到包含语义信息的向量化表示；S3：将所述按序排布的标签序列和所述包含语义信息的向量化表示解码，得到预测的标签序列；S4：使用总训练目标损失计算所述预测的标签序列和所述按序排布的标签序列之间的损失，根据损失优化所述多标签文本分类模型；S5：将待分类的测试集多标签文本输入所述多标签文本分类模型，输出对应的最终的标签序列。本发明方法有效解决了对比学习在多标签文本分析任务的适应性问题，提高多标签文本分类任务的性能。
一种基于对比学习标签文本分类方法系统

[发明专利]一种印尼语的拼写纠错方法、装置、设备及存储介质-CN202310269082.9在审
发明人：蒋盛益;陈晋毅;林楠铠 -专利权人：广东外语外贸大学
申请日： 2023-03-17 - 公布日： 2023-06-30 - 主分类号： G06F40/232 文献下载
摘要：本发明公开了一种印尼语的拼写纠错方法、装置、设备及存储介质，该方法包括：根据印尼语词典对待检测的印尼语语句进行单词检测，得到错误单词；通过语义提取模型对错误单词的上下文进行语义提取，得到上下文特征向量；基于错误单词和二元印尼语统计模型，获取候选单词集合；通过encoder‑decoder框架、错误单词和上下文特征向量，计算候选单词集合中每一候选单词的第一选取概率；根据每一候选单词与错误单词的编辑距离对相应的第一选取概率进行调整，得到候选单词的第二选取概率；根据每一候选单词的第二选取概率从候选单词集合中，选择第二选取概率最大的候选单词对错误单词进行纠正。本发明能够提高印尼语单词拼写纠正的正确率。
一种印尼拼写纠错方法装置设备存储介质

[发明专利]一种相似司法案例匹配方法、装置及设备-CN202310114952.5在审
发明人：周栋;林楠铠;范长永;阳爱民;周咏梅 -专利权人：广东外语外贸大学
申请日： 2023-02-13 - 公布日： 2023-06-27 - 主分类号： G06F16/33 文献下载
摘要：本发明公开一种相似司法案例匹配方法、装置及设备，方法包括：通过预训练语言模型和神经网络分类器，按照预设的第一模型参数对目标案例和待匹配案例中的每个句子进行特征句识别，获得目标案例特征句组和待匹配案例特征句组，并将其中的特征句组合生成若干特征句子对；通过预训练语言模型和神经网络分类器，按照预设的第二模型参数对目标案例和待匹配案例进行匹配预测，获得初始匹配结果，并按照预设的第三模型参数计算每个特征句子对的对齐概率以获得句子对齐结果；根据初始匹配结果和句子对齐结果，确定目标案例和待匹配案例之间的目标匹配结果。本发明在确保目标匹配结果的准确性的同时，能够为目标匹配结果提供可解释性依据。
一种相似司法案例匹配方法装置设备

[发明专利]一种语法纠错模型的训练方法、装置、设备及存储介质-CN202210560454.9有效
发明人：蒋盛益;林楠铠;林晓钿;武洪艳 -专利权人：广东外语外贸大学
申请日： 2022-05-23 - 公布日： 2023-05-05 - 主分类号： G06F40/253 文献下载
摘要：本发明公开一种语法纠错模型的训练方法、装置、设备及存储介质，基于Transformer构建原始模型；在每一轮训练中，将预先获取的训练集输入到所述原始模型，并结合滑动平均策略，对所述原始模型中的参数进行调整；其中，所述训练集包括若干训练样本，所述训练样本包括由若干词语组成的原始句子、与所述原始句子对应的由若干标签组成的目标句子，所述目标句子预先由所述原始句子进行语法纠错得到；当训练轮次达到预设的次数阈值时，结束算法并以最后一轮训练得到的原始模型作为最优语法纠错模型。本发明实施例能够通过利用Transformer构建原始模型，结合滑动平均策略，利用预先获取的训练集进行模型训练，获得最优语法纠错模型，避免了过拟合以及提高了模型的泛化能力。
一种语法纠错模型训练方法装置设备存储介质

[发明专利]一种中文拼写纠错方法、装置、设备及存储介质-CN202210504740.3有效
发明人：蒋盛益;林楠铠;林晓钿;武洪艳;甘诚韬;杨子渝 -专利权人：广东外语外贸大学
申请日： 2022-05-10 - 公布日： 2023-04-07 - 主分类号： G06F40/232 文献下载
摘要：本发明公开了一种中文拼写纠错方法、装置、设备及存储介质，该方法包括：获取中文文本训练序列；将中文文本训练序列输入至语义表征模型中进行语义特征提取，以得到每个所述汉字的字向量表示；将每个汉字的字向量表示输入至预先构建的反向对比学习模型中，对相同汉语拼音的不同汉字进行对比学习，得到反向对比损失；基于反向对比损失对预先构建的中文拼写纠错模型的损失函数进行优化，得到优化后的中文拼写纠错模型；通过语义表征模型和优化后的中文拼写纠错模型对待检测的中文文本序列进行检测，得到修正后的中文文本序列。本发明能够提高中文拼写纠错模型对于同音异形字的区分能力，以解决现有的中文拼写纠错方法容易混淆同音异形字的问题。
一种中文拼写纠错方法装置设备存储介质

[发明专利]一种汉语语法纠错的评估方法、装置、设备及存储介质-CN202210443576.X有效
发明人：蒋盛益;林楠铠;林晓钿;武洪艳 -专利权人：广东外语外贸大学
申请日： 2022-04-26 - 公布日： 2023-03-28 - 主分类号： G06F40/226 文献下载
摘要：本发明公开了一种汉语语法纠错的评估方法、装置、设备及存储介质，包括：对原始汉语语法纠错评估语料库的测试集进行标注，得到扩充测试集；将每一修正句子分别与所有黄金标准注释进行匹配，计算得到基于句子级别的准确率；其中，修正句子为原始句子利用待评估汉语语法纠错模型进行修正后得到的句子；对每一修正句子利用BLEU算法，计算得到基于字级别的BLEU值；将每一修正句子分别与对应的原始句子进行匹配，计算得到基于字级别的修改度；根据基于句子级别的准确率、基于字级别的BLEU值和基于字级别的修改度对待评估汉语语法纠错模型进行评估。采用本发明实施例能够科学、全面、客观地评价汉语语法纠错模型的纠错效果。
一种汉语语法纠错评估方法装置设备存储介质

[发明专利]印尼语的情感分类方法、装置、设备及介质-CN202010402298.4有效
发明人： 林楠铠;蒋盛益;林晓钿 -专利权人：广东外语外贸大学
申请日： 2020-05-13 - 公布日： 2023-03-28 - 主分类号： G06F40/211 文献下载
摘要：本发明公开了一种印尼语的情感分类方法，其特征在于，包括：获取待处理的印尼语句子，并确定所述待处理的印尼语句子对应的领域描述符；根据预设的CNN‑BILSTM模型对所述待处理的印尼语句子进行计算，得到所述待处理的印尼语句子对应的通用表示信息；根据所述领域描述符以及所述通用表示信息计算得到领域通用表示信息；将所述领域通用表示信息在当前领域对应的记忆网络样本库中进行加权计算，得到文本特征信息；根据所述文本特征信息确定对应的情感分类结果。本发明实施例还公开了一种印尼语的情感分类装置、设备及介质，使得在多个领域都可对印尼语进行情感分类。
印尼情感分类方法装置设备介质

[发明专利]样本选择方法、装置、设备及介质-CN202211606921.3在审
发明人：蒋盛益;林晓钿;林楠铠;付颖雯;杨子渝 -专利权人：广东外语外贸大学
申请日： 2022-12-14 - 公布日： 2023-03-24 - 主分类号： G06F18/211 文献下载
摘要：本发明公开一种样本选择方法、装置、设备及介质，所述方法通过分类数据增强策略生成的干净样本和噪声样本，并在干净样本中筛选高置信度的样本作为高质量样本，在噪声样本和置信度低的干净样本这类低可信度样本中进行再选择，以在高置信度的干净样本中补充高质量的低可信度样本，从而完成对增强样本中高质量样本的筛选。本发明不仅能有效筛选数据增强样本中生成的高质量样本，还增加了数据增强样本的多样性，使模型可以学到更多的模式，以提高模型的性能，从而进一步提高模型的泛化性。相应地，本发明还提供一种样本选择装置、设备及介质。
样本选择方法装置设备介质

[发明专利]多语种文本分类方法、装置、设备及介质-CN202211607728.1在审
发明人：蒋盛益;林晓钿;林楠铠;付颖雯;杨子渝 -专利权人：广东外语外贸大学
申请日： 2022-12-14 - 公布日： 2023-03-10 - 主分类号： G06F16/35 文献下载
摘要：本发明公开一种多语种文本分类方法、装置、设备及介质，所述方法通过获取目标文本和预先训练的学习模型，学习模型包括共享特征提取网络和多个子任务识别网络；通过所述共享特征提取网络得到目标文本的句向量表示和语种识别预测结果，并根据语种识别预测结果，调用对应语种的子任务识别网络对所述句向量表示模块进行处理，得到目标文本的分类结果，其中，所述子任务识别网络中的语种自学习模块通过对对应语种进行多个语种之间的相关性学习。本发明能将多个语种的语言之间的相关性知识融入模型中学习，并通过模型对多语种文本进行分类，从而更好地对多语种文本进行分类。相应地，本发明实施例还提供一种多语种文本分类装置、设备及介质。
语种文本分类方法装置设备介质

[发明专利]一种命名实体识别方法、装置、设备及存储介质-CN202211299349.0在审
发明人：蒋盛益;付颖雯;林楠铠;林晓钿;杨子渝 -专利权人：广东外语外贸大学
申请日： 2022-10-20 - 公布日： 2023-02-24 - 主分类号： G06F40/295 文献下载
摘要：本发明公开一种命名实体识别方法、装置、设备及存储介质，方法包括：基于教师模型损失函数和命名实体标注数据集对预训练的语言模型进行判别辅助任务训练，获得教师模型；利用教师模型过滤命名实体无监督样本集中存在错误预测标签的伪样本，获得第一样本集，并移除第一样本集中具有非实体标签的伪样本，获得第二样本集；然后生成第二样本集中每个伪样本所对应的伪标签，计算每个伪样本的置信度，选取置信度大于预设阈值的若干置信伪样本，并基于学生模型损失函数和命名实体标注数据集重新对预训练的语言模型进行训练，获得学生模型，以对输入的文本数据进行命名实体识别。本发明能够避免半监督学习模型在自训练过程中选择具有错误伪标签的伪样本。
一种命名实体识别方法装置设备存储介质

1
2
下一页»
尾页
共 26 条