[发明专利]一种降低端到端语音翻译跨模态跨语言障碍的方法及系统在审

专利信息
申请号: 202110753283.7 申请日: 2021-07-02
公开(公告)号: CN113569562A 公开(公告)日: 2021-10-29
发明(设计)人: 张婷;黄武伟;熊德意 申请(专利权)人: 中译语通科技股份有限公司
主分类号: G06F40/242 分类号: G06F40/242;G06F40/30;G06F40/42;G06F40/58;G06N3/04;G10L15/26
代理公司: 北京万贝专利代理事务所(特殊普通合伙) 11520 代理人: 马红
地址: 100131 北京市石景山区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 降低 端到端 语音 翻译 跨模态跨 语言障碍 方法 系统
【权利要求书】:

1.一种降低端到端语音翻译跨模态跨语言障碍的系统,其特征在于,所述降低端到端语音翻译跨模态跨语言障碍的系统,包括语音编码器和文本解码器;

其中,所述语音编码器由用于编码声学信号的几层卷积神经网络和堆叠在卷积神经网络层之上的几层Transformer编码器层组成;语音特征序列输入到模型中在经过语音编码器得到一个语音状态序列解码端采用自回归的方式基于语音编码端解码得到的状态序列生成目标语言的文本,用公式表达如下:

h=SpeechEncoder(x);

yi=TranslationDecoder(h,yi-1);

其中,x为输入的语音特征序列,yi为第i个目标词;

所述文本解码器的每一层由多头语音-文本混合注意力子层和全连接前馈神经网络子层组成,用于将语音编码器的最后一层输出的高维语音状态序列与目标语言词嵌入序列连接,并将连接后的序列作为解码器的输入;其中,连接的输入序列还包括位置编码和模态编码,用于区分目标语言词嵌入和语音状态序列。

2.一种实施权利要求1所述的降低端到端语音翻译跨模态跨语言障碍的系统的降低端到端语音翻译跨模态跨语言障碍的方法,其特征在于,所述降低端到端语音翻译跨模态跨语言障碍的方法包括以下步骤:

步骤一,数据集以及数据处理:数据集中包含训练集和测试集,利用英语到德语数据集IWSLT18和英语到法语的数据集Augmented Librispeech实现;

步骤二,模型预训练:利用源语音特征和英文转录文本数据在CNN+Transformer的语音识别模型上进行预训练,并将得到的编码端的参数来初始化语言翻译模型的编码器;

步骤三,模型训练:使用平行语料在本发明所提出的可以降低端到端语言翻译跨语言跨模态障碍的模型上进行训练;

步骤四,模型解码:在模型训练收敛后,使用测试集的数据进行测试,采用beam search算法解码,解码得到的句子使用BLEU作为翻译的评价指标。

3.如权利要求2所述的降低端到端语音翻译跨模态跨语言障碍的方法,其特征在于,步骤一中,所述IWSLT18语音翻译数据集来自TED演讲,包含271小时的演讲,171K的英语转录文本和德语翻译文本;从训练集中随机抽取2000个样本作为验证集,使用此数据集的tst2013作为测试集;

Augmented Librispeech数据集为每个实例提供英语语音信号、英语转录文本、对齐电子书中的法语文本翻译;使用100小时的干净数据进行训练;其中2小时的数据作为验证集,4小时作为测试集,分别对应47271、1071和2048个句子;通过谷歌翻译将对于转录文本进行翻译,进而得到弱标签数据;

在输入到模型之前先对数据进行预处理,将文本的句子改写成全部小写,对于解码的粒度,在IWSLT18数据集上使用字符级别,在Augmented Librispeech数据集使用子词级别,通过sentencepiece工具实现,同时生成字典;将音频信号通过开源工具kaldi提取80维的Fbank特征,步长设为10ms,窗口大小设为25ms,将每一句的语音特征长度大于4000和对齐的效果比较差的句子删除。

4.如权利要求2所述的降低端到端语音翻译跨模态跨语言障碍的方法,其特征在于,步骤二中,所述模型预训练,包括:所采用的两个数据集中都包含英文的转录文本,首先利用源语音特征和英文转录文本数据在CNN+Transformer的语音识别模型上进行预训练;由于CNN+Transformer结构的声学编码器端和声学编码器端的结构完全一致,直接将语音识别预训练得到的声学编码器端的参数来初始化声学编码器参数,并使用速度扰动技术和SpecAugment策略,扰动因子分别置为0.9,1.0和1.1。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中译语通科技股份有限公司,未经中译语通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110753283.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top