[发明专利]文本处理模型训练方法、语音文本处理方法及装置有效

专利信息
申请号: 202110704938.1 申请日: 2021-06-24
公开(公告)号: CN113420121B 公开(公告)日: 2023-07-28
发明(设计)人: 周军;张震;李成章;李鹏;刘建;石瑾;刘睿霖;颜永红 申请(专利权)人: 中国科学院声学研究所;国家计算机网络与信息安全管理中心
主分类号: G06F16/33 分类号: G06F16/33;G06F16/332;G06F16/951;G06F18/214
代理公司: 北京亿腾知识产权代理事务所(普通合伙) 11309 代理人: 陈霁
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 处理 模型 训练 方法 语音 装置
【说明书】:

本申请提供了一种文本处理模型训练方法、语音文本处理方法及装置,涉及自然语言处理技术领域。该方法包括:从互联网爬取对话文本,得到正样本;对对话文本中的语句进行变换操作,得到负样本和负样本的第一标签信息;将正样本和负样本对应输入至预先训练的第一文本处理模型中和待训练的第二文本处理模型中,生成第一文本处理模型的目标层的第一特征向量和第二文本处理模型的目标层的第二特征向量;根据第一特征向量、第二特征向量,对第二文本处理模型进行知识蒸馏,得到训练好的第二文本处理模型。根据本申请实施例,能够解决相关技术中对语音文本进行校对效率低、耗时长且计算资源占用大的问题。

技术领域

本申请涉及自然语言处理技术领域,尤其涉及一种文本处理模型训练方法、语音文本处理方法及装置。

背景技术

随着自然语言处理技术的发展和人们对高效率的需求,语音识别技术已经被广泛地应用于生活的各个领域,如将会议内容录音后转换文本作为会议纪要;对老师讲课的录音内容转换成文本作为课堂笔记等等。

目前,为了能够准确地识别将语音转换成文本,且转换的文本能够易于用户理解,需要对识别的语音转换成文本,然后再对文本进行校对,从而得到易于用户理解的文本。但是,相关技术中对文本校对的模型在训练时,由于缺乏足量的训练样本,模型难以训练,且即使成功,得到的文本校对模型也需要进行多次迭代来完成文本校对,因此,耗时较长,效率低,且计算资源占用大。

发明内容

本申请实施例提供了一种文本处理模型训练方法、语音文本处理方法及装置,能够解决相关技术中对语音文本进行校对效率低、耗时长且计算资源占用大的问题。

第一方面,本申请实施例提供了文本处理模型训练方法,该方法包括:

从互联网爬取对话文本,得到正样本;对话文本中的语句为语法正确的语句,正样本为对话文本中的语句;

对对话文本中的语句进行变换操作,得到负样本和负样本的第一标签信息,负样本中的语句为语法错误的语句,第一标签信息表示将正样本变换为负样本的变换序列;

将正样本和负样本对应输入至预先训练的第一文本处理模型中和待训练的第二文本处理模型中,生成第一文本处理模型的目标层的第一特征向量和第二文本处理模型的目标层的第二特征向量;第二文本处理模型的维度小于第一文本处理模型,第一文本处理模型是根据正样本、负样本和负样本的变换序列训练得到的;

根据第一特征向量、第二特征向量,对第二文本处理模型进行知识蒸馏,得到训练好的第二文本处理模型。

在一种可能的实现方式中,在第一文本处理模型的层数与第二文本处理模型的层数相同的情况下,第一特征向量包括第一输入层特征向量、第一隐藏层特征向量、第一注意力向量和对负样本进行校对的第一预测校对向量,第二特征向量包括第二输入层特征向量、第二隐藏层特征向量、第二注意力向量和对负样本进行校对的第二预测校对向量。

在一种可能的实现方式中,根据第一特征向量和第二特征向量,对第二文本处理模型进行知识蒸馏,得到训练好的第二文本处理模型,包括:

根据第一文本处理模型的维度和第二文本处理模型的维度,确定投影矩阵;

根据投影矩阵、第一输入层特征向量和第二输入层特征向量,计算第一文本处理模型的输入层和第二文本处理模型的输入层之间的第一均方差损失;

根据投影矩阵、第一隐藏层特征向量和第二隐藏层特征向量,计算第一文本处理模型的隐藏层和第二文本处理模型的隐藏层之间的第二均方差损失;

计算第一注意力向量和第二注意力向量之间的第三均方差损失;

根据预设的温度参数计算第一预测校对向量和第二预测校对向量的交叉熵损失;

根据第一均方差损失、第二均方差损失、第三均方差损失和交叉熵损失更新第二文本处理模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;国家计算机网络与信息安全管理中心,未经中国科学院声学研究所;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110704938.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top