[发明专利]比喻句式判断模型的训练方法、装置、介质及设备有效
申请号: | 202110998207.2 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113806532B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 常永炷;毛晓曦;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/335;G06F18/214;G06F18/21 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 徐世俊 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 比喻 句式 判断 模型 训练 方法 装置 介质 设备 | ||
1.一种比喻句式判断模型的训练方法,其特征在于,所述方法包括下述步骤:
通过预训练的比喻句式判断模型判断输入语句是否为比喻句式,得到与所述输入语句对应的第一判断结果;
当所述第一判断结果指示所述输入语句是比喻句式时,对所述输入语句基于比喻句式构建规则进行数据增强处理,得到扩充语句;
通过所述比喻句式判断模型判断所述扩充语句是否为比喻句式,得到与所述扩充语句对应的第二判断结果;
基于所述第二判断结果对所述扩充语句设置标签,将所述设置标签的扩充语句作为所述比喻句式判断模型新增的训练样本,以迭代训练所述比喻句式判断模型;
所述基于所述第二判断结果对所述扩充语句设置标签,将所述设置标签的语句作为所述比喻句式判断模型新增的训练样本,包括:
给所述第二判断结果中指示为比喻句式的输入语句设置第一标签,将设置所述第一标签的输入语句作为所述比喻句式判断模型新增的正样本;
给所述第二判断结果中指示为非比喻句式的输入语句设置第二标签,将设置所述第二标签的输入语句作为所述比喻句式判断模型新增的负样本。
2.如权利要求1所述的比喻句式判断模型的训练方法,其特征在于,在所述通过预训练的比喻句式判断模型判断输入语句是否为比喻句式,得到与所述输入语句对应的第一判断结果之前,所述方法还包括:
获取待训练的比喻句式判断模型初始的训练样本,所述训练样本包括设置有标签的语句,所述标签用于指示所述语句是否为比喻句式;
通过所述待训练的比喻句式判断模型对所述初始的训练样本中的语句进行特征提取,得到与所述语句对应的文本特征向量;
通过所述待训练的比喻句式判断模型,基于所述文本特征向量判断所述训练样本中的语句是否为比喻句式,得到与所述语句对应的第三判断结果;
基于所述第三判断结果及所述训练样本的标签,调整所述待训练的比喻句式判断模型的参数,得到预训练的比喻句式判断模型。
3.如权利要求2所述的比喻句式判断模型的训练方法,其特征在于,所述基于所述第二判断结果对所述扩充语句设置标签,将所述设置标签的扩充语句作为所述比喻句式判断模型新增的训练样本,以迭代训练所述比喻句式判断模型,包括:
基于所述第二判断结果对所述扩充语句设置标签,将所述设置标签的扩充语句作为所述比喻句式判断模型新增的训练样本;
基于新增的训练样本和所述初始的训练样本,对所述待训练的比喻句式判断模型进行训练,得到预训练的比喻句式判断模型;
获取新的输入语句,返回执行所述通过预训练的比喻句式判断模型判断输入语句是否为比喻句式,得到与所述输入语句对应的第一判断结果的步骤,直到满足模型训练结束条件为止,得到训练完成的比喻句式判断模型。
4.如权利要求2所述的比喻句式判断模型的训练方法,其特征在于,所述获取待训练的比喻句式判断模型初始的训练样本,包括:
对预先构建的比喻句式语句基于比喻句式构建规则进行数据增强处理得到所述初始的训练样本。
5.如权利要求1所述的比喻句式判断模型的训练方法,其特征在于,所述对所述输入语句基于比喻句式构建规则进行数据增强处理,得到扩充语句,包括:
提取所述输入语句中位于预设关键词之前和/或之后的语句段;
通过预先训练好的语句构建模型,对所述语句段基于比喻句式构建规则进行扩写,生成完整的扩充语句。
6.如权利要求1所述的比喻句式判断模型的训练方法,其特征在于,在所述通过预训练的比喻句式判断模型判断输入语句是否为比喻句式之前,所述方法还包括:
根据预设的数据过滤规则,将符合所述数据过滤规则要求的原始语句进行筛除,得到筛除后的所述输入语句。
7.一种比喻句式判断方法,其特征在于,采用如权利要求1-6任一项所述的训练完成的比喻句识别模型进行比喻句识别,所述方法包括:
接收待识别的输入语句;
基于所述比喻句式判断模型,提取所述输入语句的文本特征;
根据所述文本特征判断所述输入语句是否为比喻句式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110998207.2/1.html,转载请声明来源钻瓜专利网。