[发明专利]语病诊断模型的训练方法、语病诊断方法、装置及设备有效

专利信息
申请号: 202210502759.4 申请日: 2022-05-10
公开(公告)号: CN114611497B 公开(公告)日: 2022-08-16
发明(设计)人: 李云良;胡飞;李木子 申请(专利权)人: 北京世纪好未来教育科技有限公司
主分类号: G06F40/253 分类号: G06F40/253;G06F40/30;G06F16/35;G06N3/04;G06N3/08
代理公司: 北京开阳星知识产权代理有限公司 11710 代理人: 范彦扬
地址: 100089 北京市海淀区中*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语病 诊断 模型 训练 方法 装置 设备
【权利要求书】:

1.一种语病诊断模型的训练方法,包括:

获取携带有语病标签的文本样本;所述语病标签包括所述文本样本的语病类别和语病位置;

根据预先设置的语病模板和所述文本样本的语病标签,得到嵌入语病信息的模板文本;其中,所述语病模板为用于指示查找指定语病的位置的文本,且所述语病模板中指定语病的信息待嵌入;所述根据预先设置的语病模板和所述文本样本的语病标签,得到嵌入语病信息的模板文本的步骤,包括:从所述文本样本的语病标签中提取语病类别,将提取的所述语病类别作为指定语病的类别,并将所述指定语病的类别以填槽方式嵌入所述语病模板中,以得到嵌入语病信息的模板文本;

基于所述模板文本和所述携带有语病标签的文本样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型;其中,所述语病诊断模型用于对目标文本进行识别,得到所述目标文本中的语病类别及语病位置;

所述文本样本的数量为N个,不同所述文本样本的语病类别和/或语病位置不同,且N个所述文本样本共包含M种语病类别;

所述模板文本的数量为M个,每个所述模板文本对应一种语病类别;N与M均为正整数;

基于所述模板文本和所述携带有语病标签的文本样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型的步骤,包括:

将M个所述模板文本和N个所述携带有语病标签的文本样本进行组合,得到M*N个组合样本;

基于所述M*N个组合样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型;

基于所述M*N个组合样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型的步骤,包括:

对于每种语病类别,基于所述M*N个组合样本得到该种语病类别对应的正样本和负样本;

根据每种所述语病类别对应的正样本和负样本,对预设的神经网络模型进行训练,得到训练好的语病诊断模型。

2.如权利要求1所述的语病诊断模型的训练方法,其中,所述指定语病的信息包括指定语病的类别和定义。

3.如权利要求2所述的语病诊断模型的训练方法,其中,根据预先设置的语病模板和所述文本样本的语病标签,得到嵌入语病信息的模板文本的步骤,包括:

查找所述语病类别对应的语病定义,并将查找到的所述语病定义作为指定语病的定义,并将所述指定语病的定义以填槽方式嵌入所述语病模板中,得到嵌入语病信息的模板文本。

4.如权利要求1所述的语病诊断模型的训练方法,其中,对于每种语病类别,基于所述M*N个组合样本得到该种语病类别对应的正样本和负样本的步骤,包括:

对于每种语病类别,从所述M*N个组合样本中查找第一目标组合样本和第二目标组合样本;所述第一目标组合样本中的模板文本对应该种语病类别,且所述第一目标组合样本中的语病标签包含该种语病类别;所述第二目标组合样本中的模板文本对应该种语病类别,且所述第二目标组合样本中的语病标签不包含该种语病类别;

对所述第一目标组合样本执行第一处理操作,将第一处理操作后的所述第一目标组合样本作为该种语病类别对应的正样本;其中,所述第一处理操作包括将所述第一目标组合样本的语病标签中除该种语病类别之外的语病类别剔除;

对所述第二目标组合样本执行第二处理操作,将第二处理操作后的所述第二目标组合样本作为该种语病类别对应的负样本;其中,所述第二处理操作包括将所述第二目标组合样本的所有语病标签剔除。

5.如权利要求1所述的语病诊断模型的训练方法,其中,根据每种所述语病类别对应的正样本和负样本,对预设的神经网络模型进行训练,得到训练好的语病诊断模型的步骤,包括:

基于每种所述语病类别对应的正样本和负样本进行合并处理,得到样本训练集;

采用所述样本训练集对预设的神经网络模型进行训练,得到训练好的语病诊断模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210502759.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top