[发明专利]带有复制机制的神经机器翻译方法有效

专利信息
申请号: 201711441339.5 申请日: 2017-12-27
公开(公告)号: CN108132932B 公开(公告)日: 2021-07-20
发明(设计)人: 熊德意;邝少辉 申请(专利权)人: 苏州大学
主分类号: G06F40/58 分类号: G06F40/58
代理公司: 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 代理人: 冯瑞;杨慧林
地址: 215104 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种带有复制机制的神经机器翻译方法,应用在基于注意力机制且采用encoder‑decoder框架的NMT模型,包括:在原始训练语句的源语言和目标语言中,标记出需要指定翻译的源短语和对应的目标短语;把原始训练语句中的源语言中需要指定翻译的源短语替换为原始训练语句中的目标语言中对应的目标短语;对上述处理过的原始训练语句进行NMT系统的训练;在待翻译的源语句中,标记出需要指定翻译的短语。上述带有复制机制的神经机器翻译方法,可以很好翻译特定的短语,如人名,地名,机构名,品牌词等,可以和任何的语料处理技术兼容,进一步提升翻译效果,不需要更改NMT系统结构,可以方便的应用在任何NMT系统上面。
搜索关键词: 带有 复制 机制 神经 机器翻译 方法
【主权项】:
一种带有复制机制的神经机器翻译方法,应用在基于注意力机制且采用encoder‑decoder框架的NMT模型,其特征在于,包括:在所述原始训练语句的源语言和目标语言中,标记出需要指定翻译的源短语和对应的目标短语;把原始训练语句中的源语言中需要指定翻译的源短语替换为原始训练语句中的目标语言中对应的目标短语;对上述处理过的原始训练语句进行NMT系统的训练;在待翻译的源语句中,标记出需要指定翻译的短语,所述标记的方法采用与步骤“在原始训练语句中的源语言和目标语言,标记出需要指定翻译的源短语和对应的目标短语;”中标记的方法相同;把待翻译的源语句中的需要指定翻译的源短语替换为目标语言中对应的目标短语;对上述处理过的待翻译的源语句进行NMT系统的解码翻译。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711441339.5/,转载请声明来源钻瓜专利网。

同类专利
  • 文本翻译方法、装置、电子设备及存储介质-202310733284.4
  • 刘秋志 - 腾讯科技(深圳)有限公司
  • 2023-06-20 - 2023-10-27 - G06F40/58
  • 本公开关于文本翻译方法、装置、电子设备及存储介质,涉及人工智能技术领域,包括:获取待翻译文本信息;对待翻译文本信息和预设翻译记忆数据中每个待选翻译记忆对对应的未学习短语集进行匹配处理,得到至少一个目标匹配短语集;目标匹配短语集中存在未学习短语与待翻译文本信息相匹配;任一待选翻译记忆对对应的未学习短语集为任一待选翻译记忆对的翻译记忆原文信息中对应的记忆翻译结果与预设机器翻译模型的翻译结果存在差异的短语集合;基于至少一个目标匹配短语集对应的目标翻译记忆对和预设机器翻译模型,对待翻译文本信息进行翻译处理,得到目标语言文本信息。利用本公开实施例可以提高翻译准确性的同时,减少运算成本的浪费。
  • 译文词汇补全方法、装置、计算机设备、存储介质及产品-202310366094.3
  • 刘乐茂;杨程 - 腾讯科技(深圳)有限公司
  • 2023-03-30 - 2023-10-27 - G06F40/58
  • 本申请公开了一种译文词汇补全方法、装置、计算机设备、存储介质及产品,涉及机器翻译技术领域。该方法包括:对翻译原句、翻译上下文和第i候补词汇进行特征提取,得到第i候补词汇的第i上下文特征,第i上下文用于表征第i候补词汇与翻译原句和翻译上下文之间的上下文交互信息,i是正整数;基于第i上下文特征进行缺失词汇预测,得到第i预测概率,第i预测概率用于表征第i候补词汇是翻译上下文中缺失词汇的概率;基于k个候补词汇的k个第i预测概率,从k个候补词汇中确定翻译上下文中的缺失词汇,k是大于等于i的整数。该方法可以提高双语翻译场景下缺失词汇的补全准确性。
  • 翻译模型的训练方法、装置、设备、介质及程序产品-202310622868.4
  • 王星;郭政晟;何志威;焦文祥;涂兆鹏;王瑞;陈科海;张民 - 腾讯科技(深圳)有限公司
  • 2023-05-29 - 2023-10-27 - G06F40/58
  • 本申请公开了一种翻译模型的训练方法、装置、设备、介质及程序产品,涉及翻译领域。该方法包括:通过候选翻译模型提取样本手语文本对应的中间视频特征表示,并对中间视频特征表示进行文本预测,得到第一手语文本;提取样本手语视频对应的中间文本特征表示,并对中间文本特征表示进行视频预测,得到第一手语视频;基于第一手语文本与样本手语文本之间的第一差异,以及第一手语视频与样本手语视频之间的第二差异,对候选翻译模型进行训练,得到第一翻译模型。采用无监督的训练方法,不需要对模型的训练数据(即样本手语文本和样本手语视频)进行人工标签标注,降低了对于训练数据的获取成本,提高了对翻译模型的训练效率。
  • 机器翻译模型的训练方法、装置、介质及产品-202310021217.X
  • 王星;何志威;涂兆鹏;王瑞;史树明 - 腾讯科技(深圳)有限公司
  • 2023-01-06 - 2023-10-27 - G06F40/58
  • 本申请公开了一种机器翻译模型的训练方法、装置、介质及产品,涉及人工智能领域。该方法包括:获取第一内容集和第二内容集;从所述第一内容集中获取第一样本语句,以及,从所述第二内容集中获取语义匹配的第二样本语句;通过候选机器翻译模型对所述第一样本语句和所述第二样本语句向目标自然语言进行翻译,得到第一翻译数据和第二翻译数据;通过降低所述第一翻译数据和所述第二翻译数据之间的差异对所述候选机器翻译模型进行训练。针对低资源语料通过高资源预料的翻译预测过程进行蒸馏训练,在无需增加低资源语料数量的基础上,能够提高低资源语料的翻译准确率,提高了机器翻译模型的训练效率以及训练准确。
  • 基于联邦学习的机器翻译方法、装置、设备、介质及程序-202310029048.4
  • 杜逸超;张志锐;吴秉哲;刘乐茂 - 腾讯科技(深圳)有限公司
  • 2023-01-09 - 2023-10-27 - G06F40/58
  • 本申请公开了一种基于联邦学习的机器翻译方法、装置、设备、介质及程序,涉及机器学习领域。该方法包括:接收中心节点发送的参考翻译模型;获取第二数据集,第二数据集中包括多个与计算节点对应的翻译内容对;将翻译内容对输入参考翻译模型,输出得到翻译内容对中翻译结果对应的上下文特征表示,并将上下文特征表示和翻译结果作为键值对生成节点记忆库;将节点记忆库发送至中心节点,并接收中心节点发送的聚合记忆库。通过上述方式,能够在数据无法直接传输的情况下,避免对模型参数进行多次更新,避免消耗过多的通信开销。本申请可应用于云技术、人工智能、智慧交通等各种场景。
  • 机器翻译方法、装置、设备、介质及程序产品-202310304742.2
  • 刘乐茂;郝宏坤 - 腾讯科技(深圳)有限公司
  • 2023-03-24 - 2023-10-27 - G06F40/58
  • 本申请公开了一种机器翻译方法、装置、设备、介质及程序产品,涉及机器翻译技术领域。该方法包括:对第一语句和第i个第二语句分别进行特征提取,得到第一语句对应的第一特征表示和第i个第二语句对应的第二特征表示;对第一特征表示和第i个第二语句对应的第二特征表示进行联合解码,得到第一语句对应的第i个候选翻译结果;对多个第二语句分别对应的候选翻译结果进行融合分析,得到与第一语句对应的目标翻译语句。通过对翻译结果的融合,降低由于TM增强的机器翻译模型方差较大对翻译结果质量的影响,同时降低了机器翻译模型可能产生的偏差对翻译结果质量的影响,从而提高了机器翻译模型翻译得到的翻译语句的质量。
  • 文本翻译方法、装置、计算机设备、存储介质及程序产品-202310361505.X
  • 王龙跃;王志豪;涂兆鹏 - 腾讯科技(深圳)有限公司
  • 2023-03-31 - 2023-10-27 - G06F40/58
  • 本申请公开了一种文本翻译方法、装置、计算机设备、存储介质及程序产品,涉及机器翻译技术领域。该方法包括:通过翻译模型中的编码器对源语言文本进行特征编码,得到源语言文本的文本语义特征和字符数量信息,字符数量信息用于指示源语言文本中每个字符与预测翻译文本中字符之间的数量对应关系;按照字符数量信息对源语言文本中的各个字符进行字符复制操作,生成源语言字符序列;通过翻译模型中的解码器对文本语义特征和源语言字符序列进行特征解码,得到源语言文本的预测翻译文本,解码器的解码器层数小于编码器的编码器层数。该文本翻译方法可以提高翻译模型的翻译速率。
  • 一种文本翻译方法、装置、终端设备和存储介质-202210403340.3
  • 张明云 - 广东小天才科技有限公司
  • 2022-04-18 - 2023-10-27 - G06F40/58
  • 本申请适用于文本翻译技术领域,提供了一种文本翻译方法、装置、终端设备和存储介质。其中,上述文本翻译方法具体包括:获取干预文本的正确翻译结果,所述干预文本为翻译得到的翻译结果存在错误的已翻译文本;获取待翻译文本;若所述待翻译文本与所述干预文本相同,则将所述干预文本的正确翻译结果作为所述待翻译文本的目标翻译结果。本申请的实施例可以避免在文本翻译时一直采用错误的翻译结果,提高了文本翻译的准确性。
  • 一种手势语言与语音语言双向智能翻译装置-201811557094.7
  • 许开松 - 上海立势达机电科技有限公司
  • 2018-12-19 - 2023-10-27 - G06F40/58
  • 本发明公开了一种手势语言与语音语言双向智能翻译装置,包括,壳体,壳体两侧分别固定有配合安装板,收纳槽侧壁分别通过转轴与摄像支撑块铰接,摄像支撑块与摄像支撑杆一端装配固定,摄像支撑杆另一端上固定有摄像头;行程槽内安装有行程开关,扩音槽内安装有扩音器、拾音器,扩音器用于发出声音,拾音器用于输入声音;转轴槽内安装有铰接块部分,铰接轴穿过铰接块部分且两端分别与配合安装板可转动装配,铰接块部分设置在触摸屏一端,触摸屏两侧分别固定有锁板,锁板上分别设置有锁孔,锁孔贯穿锁板;壳体靠近锁槽处设置有电磁安装槽,电磁安装槽内安装有电磁铁,电磁铁与伸缩轴一端装配,伸缩轴另一端穿过电磁固定板、锁槽后与锁孔卡合装配。
  • 翻译机器人选择方法-201811091026.6
  • 何征宇;何恩培;郑丽华;王莲 - 传神语联网网络科技股份有限公司
  • 2018-09-19 - 2023-10-27 - G06F40/58
  • 本发明提出了一种翻译机器人的选择方法,可以根据待译资料的属性,从翻译机器人群中选择数量合适的机器人进行翻译;并且能够在翻译过程中基于翻译结果对翻译机器人的属性进行更新,从而为下一次选择翻译机器人提供更准确的参考依据。利用本发明的方法,翻译机器人越多,越有更多的参考历史记录用于选择,选择效果更好;此外,相关翻译人员还可以根据实际翻译精度需要,基于翻译市场要求,通过设置匹配条件的高低,从而控制选择出的翻译机器人的数量。
  • 实体名词标注方法和装置、计算设备和可读存储介质-202010746638.5
  • 马应龙;刘洪;邢睿;欧小靓 - 腾讯科技(深圳)有限公司
  • 2020-07-29 - 2023-10-27 - G06F40/58
  • 公开了实体名词标注方法和装置、计算设备和计算机可读存储介质。该实体名词标注方法,包括:展示待标注的文本,待标注的文本包括第一语种文本和与第一语种文本相关联的第二语种文本;响应于分别对第一语种文本和第二语种文本的名词标注操作,将名词标注操作对应的第一语种实体名词和第二语种实体名词添加到实体名词标注区域;根据实体名词标注区域中对应显示的第一语种实体名词和第二语种实体名词,生成名词标注结果。通过本发明提供的实施例,可以对两种文本进行标注并且对两种文本的标注结果进行配对,实现了两种文本的标注结果的对应关系,从而生成了具有配对关系的资源库。
  • 一种信息处理方法、装置、计算机设备及存储介质-201910888623.X
  • 吴晓琳 - 北京小米智能科技有限公司
  • 2019-09-19 - 2023-10-27 - G06F40/58
  • 本公开是关于一种信息处理方法、装置、计算机设备及存储介质,所述方法包括:利用机器翻译模型的编码器对待翻译词句进行编码,得到编码信息;保存所述全局注意力参数;利用所述机器翻译模型的解码器,在所述待翻译词句中每一个词语的所述编码信息的解码循环中,根据所述全局注意力参数确定所述解码器的全局注意力;根据所述全局注意力获得对应所述解码循环中所要预测的词语的预测结果。由于会将解码时需要用到的全局注意力参数保存起来,因此,在解码器需要利用全局注意力参数确定全局注意力时可以直接调取存储的全局注意力参数,而不需要再次通过处理编码信息得到全局注意力参数,减少解码过程中的计算量;从而提高机器翻译模型的推理效率。
  • 一种文本信息的翻译方法、装置、电子设备和存储介质-202011254775.3
  • 徐民凯;王明轩;李磊 - 北京有竹居网络技术有限公司
  • 2020-11-11 - 2023-10-27 - G06F40/58
  • 本公开实施例公开了一种文本信息的翻译方法、装置、电子设备和存储介质,该方法包括:根据获取到的并行语料对集合,对各初始翻译模型分别进行初始翻译训练,以获取初始训练完成的多个基础翻译模型;根据获取到的单语语料集合,对各基础翻译模型进行迭代训练,直至各基础翻译模型的输出结果之间的相似度符合预设相似阈值时,将当前各基础翻译模型作为增强翻译模型;通过各增强翻译模型,对待处理的文本信息进行翻译处理,以将文本信息翻译为目标语言文本。本公开实施例的技术方案,使得在缺少足够并行语料的情况下,仅根据少量的并行语料,依然可以通过单语语料建立语言翻译模型,在获取到大量并行语料的同时,提高了语言翻译模型的翻译准确性。
  • 一种同传翻译系统及同传翻译终端-202311024945.2
  • 黄发洋;李艳雄;席艺涵 - 宁波译链科技有限公司
  • 2023-08-15 - 2023-10-24 - G06F40/58
  • 本发明公开了一种同传翻译系统及同传翻译终端,涉及翻译系统技术领域,质量评估模块基于质量分析模型综合分析理解数据以及翻译数据,评估当前翻译质量是否合格,当评估结果为当前翻译质量不合格时,调控模块唤醒二次优化模块,二次优化模块选择其它翻译器重新对获取内容进行多次翻译,若重新翻译质量连续超过两次不合格,则提示演讲者重新输入语音,若翻译质量合格,翻译数据发送至文本合成模块,当评估结果为当前翻译质量合格时,调控模块将翻译数据发送至文本合成模块。本发明翻译系统在进行视频会议翻译时,能够实时评估翻译质量并做出处理,有效保障翻译准确性,从而保障会议的稳定进行。
  • 一种文本翻译方法、装置、设备及可读存储介质-202311181680.7
  • 王瑜 - 成都帆点创想科技有限公司
  • 2023-09-14 - 2023-10-24 - G06F40/58
  • 本申请公开了计算机技术领域内的一种文本翻译方法、装置、设备及可读存储介质。本申请对于一个目标翻译任务,先在预设的翻译路径库中确定符合该目标翻译任务的至少一条目标翻译路径,以确定模型执行该目标翻译任务时的翻译路径。之后在预设的翻译提示库中为目标翻译任务匹配翻译提示信息,以使人工智能模型按照至少一条目标翻译路径和翻译提示信息执行目标翻译任务,由此可使人工智能模型执行目标翻译任务输出的翻译结果遵循翻译提示信息和目标翻译路径,既能提升翻译准确性,又能够使翻译结果按照翻译提示信息个性化或风格化。
  • 神经机器翻译模型的生成方法、翻译方法及装置-202210334088.5
  • 穆畅;李响 - 北京小米移动软件有限公司;北京小米松果电子有限公司
  • 2022-03-30 - 2023-10-24 - G06F40/58
  • 本公开关于一种神经机器翻译模型的生成方法、翻译方法及装置,属于机器翻译技术领域。其中,该方法包括:获取待翻译的样本语句和样本语句的翻译结果语句,获取样本语句的字符切分序列和子词切分序列,根据字符切分序列、子词切分序列和翻译结果语句对待训练的神经机器翻译模型进行训练,以生成神经机器翻译模型。因此,本公开根据样本语句的字符切分序列、子词切分序列和翻译结果语句对待训练的神经机器翻译模型进行训练,生成神经机器翻译模型,提高了神经机器翻译模型翻译的质量。
  • 数据库制作装置以及检索系统-201910794646.4
  • 坂本大辅 - 本田技研工业株式会社
  • 2019-08-27 - 2023-10-24 - G06F40/58
  • 本发明提供一种数据库制作装置以及检索系统,能够在提高有用性的同时制作数据库。数据处理服务器(2)从外部服务器(6)获取日语数据和外语数据,利用机器翻译将外语数据翻译成日语数据,从而制作机器翻译数据,并通过将机器翻译数据作为日语数据的一部分与其组合来制成混合数据,利用混合数据制成保存数据。
  • 翻译成盲文-202010098155.9
  • C·E·贝勒尔;S·佩尔温;C·M·特瑞米 - 国际商业机器公司
  • 2020-02-18 - 2023-10-24 - G06F40/58
  • 本公开涉及翻译成盲文。为场景的数字图像生成结构化描述。结构化描述可以包括场景的第一特征和第二特征。结构化描述还可以包括第一特征的第一细节和第二特征的第二细节。便携式盲文序列打印机可以使用结构化描述来生成第一特征和第二特征的盲文文本。便携式盲文序列打印机还可以响应于来自用户的关于第一特征的提示来生成关于第一细节的附加盲文文本。
  • 用于神经临床释义生成的系统和方法-201780008325.6
  • S·S·阿尔哈桑;刘波;O·F·法里;柳俊毅;A·普拉卡什 - 皇家飞利浦有限公司
  • 2017-01-23 - 2023-10-24 - G06F40/58
  • 本公开涉及释义生成系统。所述系统包括一个或多个硬件处理器和/或其他部件。所述系统被配置为获得训练语料库。所述训练语料库包括语言和对语言的已知释义。所述系统被配置为基于所述训练语料库来生成基于单词级关注的模型和基于字符级关注的模型。所述系统被配置为基于所述基于单词级关注的模型和所述基于字符级关注的模型两者来提供自然语言输入的一个或多个候选释义。所述基于单词级关注的模型是单词级双向长短期记忆(LSTM)网络,并且所述基于字符级关注的模型是字符级双向LSTM网络。所述单词级LSTM网络和所述字符级LSTM网络是基于所述训练语料库中的单词和字符来生成的。在一些实施例中,所述LSTM网络是堆叠的残余LSTM网络,其包括给定LSTM网络的堆叠层之间的残余连接。
  • 一种扫描式翻译笔-202320870914.8
  • 张鹏 - 深圳市艾一卓信息技术有限公司
  • 2023-04-18 - 2023-10-24 - G06F40/58
  • 本实用新型涉及翻译笔技术领域,特别是一种扫描式翻译笔,包括笔体,所述笔体的底部固定连接有光学扫描头,所述笔体的侧面设置有调节构件,所述调节构件包括组装板,所述组装板的一侧固定连接有调节框,所述调节框的一侧滑动连接有卡接柱,所述卡接柱的一侧固定连接有挤压板。本实用新型的优点在于:将定位板调节完成之后,使用者需要手持笔体并将转动辊放置在词语的分割处,随后拉动笔体使其带动光学扫描头进行滑动即可进行翻译作业,而且通过透明观察窗便于观察文本,而且通过定位板与转动辊的配合,可以起到精准定位的目的,不会扫描到起始字的前一个词,或者扫描到起始词前方的标点符号,将会提高翻译笔的翻译效果。
  • 一种前端自动翻译字典值的方法及组件-202310740070.X
  • 徐家祥;熊仁都;徐玉中;黄佳;马翔宇;郭辉 - 三峡高科信息技术有限责任公司
  • 2023-06-21 - 2023-10-20 - G06F40/58
  • 本发明提供了一种前端自动翻译字典值的方法及组件包括:获取待翻译信息,并将待翻译信息划分为若干个子信息,在预设字典数据库中分别查找每一子信息,提取查找成功的第一子信息,并在字典数据库中获取每条第一子信息对应的第一字典数据,提取在字典数据库中查找失败的第二子信息,在服务器中发起查找请求分别查找每条第二子信息,得到每条第二子信息对应的编码数据,根据编码数据建立第二字典数据,将第二字典数据输入到预设字典数据库中进行存储,以及根据每条第一子信息对应的第一字典数据和每条第二子信息对应的编码数据为待翻译信息建立字典值信息,这样一来可以减缓服务器的请求压力,提高了翻译的速度,大大减小了服务器崩溃的几率。
  • 一种通过预训练弥合模态差异的端到端图片翻译方法-202310782138.0
  • 熊德意;朱少林;李上杰;雷易锟 - 天津大学
  • 2023-06-29 - 2023-10-20 - G06F40/58
  • 本发明的目的是提供一种通过预训练弥合模态差异的端到端图片翻译方法,所述方法分为两个阶段,第一阶段是文本翻译预训练,第二阶段为图片翻译预训练;所述文本翻译预训练,使用大规模双语数据训练一个基于Transformer结构的编码器‑解码器翻译模型;所述图片翻译预训练,图片翻译模型使用中编码器‑解码器翻译模型作为初始化,然后为模型配置一个视觉编码器;共享编码器能够同时接受视觉序列信息与文本序列信息,需要在共享编码器中促进相同语义的图片和文字的表示进行对齐。本发明大大提高了端到端图片翻译模型的性能,达到并超过了级联系统,同时相比传统级联其速度有了显著的提高。
  • 支持文本翻译的重用的逻辑指针-202310425148.9
  • D·布克曼 - SAP欧洲公司
  • 2023-04-19 - 2023-10-20 - G06F40/58
  • 描述了用于促进文本翻译的重用的技术和方案。对于人类语言的文本的第一实例,第一逻辑指针值被分配给该文本的第一实例,指向具有该文本的至少第一翻译的目标。接收文本的第二实例。如果只存在第一实例,则第一逻辑指针值被分配给第二实例。如果存在与第二翻译和第二逻辑指针值相关联的文本的第三实例,则接收确定第一逻辑指针值还是第二逻辑指针值被分配给第二实例的用户或过程输入。可以向用户提供上下文信息来帮助确定第二实例应该与第一翻译还是第二翻译相关联。
  • 一种智能穿戴设备的实时翻译方法、系统及介质-202311177863.1
  • 陈泽鹏;赵磊;刘福亮;卜凯 - 深圳市微克科技有限公司
  • 2023-09-13 - 2023-10-20 - G06F40/58
  • 本申请实施例提供了一种智能穿戴设备的实时翻译方法、系统及介质,该方法包括:获取交流场景,根据交流场景获取交流信息,根据交流信息生成语义信息;根据语义信息生成交流差异信息,根据交流差异信息建立翻译信息;根据翻译信息生成交流数据转换信息,根据交流数据转换信息对语义信息进行解析,得到转换结果;判断转换结果是否满足要求;若满足要求,则将转换结果输出至智能穿戴设备终端;若不满足要求,则修正信息,根据修正信息将交流数据转换信息进行修正调整;通过交流场景判断交流信息的差异性,并进行交流数据的转换,使交流信息可以进行实时翻译成可以理解的交流数据,用于语音翻译任务,满足用户夸语言交流。
  • 基于短语的神经机器翻译的方法及系统-202010145476.X
  • 陈巍华 - 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司
  • 2020-03-03 - 2023-10-20 - G06F40/58
  • 本发明提供的基于短语的神经机器翻译的方法及系统,通过:由单语的源语料生成包含子词、词以及短语的源词典;由单语的目标语料生成包含子词、词以及短语的目标词典;源语料通过源词典、目标语料通过目标词典分别转化成相应的词向量;对S2步骤得到的词向量进行神经网络训练,从而得到最终的翻译模型。本发明提供的基于短语的神经机器翻译方法及系统,通过在训练中引入了短语的信息,将句子中常见的短语作为一个整体来进行翻译,能保证在翻译的过程中不会被切分的很碎,导致错翻或者漏翻的情况出现。
  • 语音翻译方法、装置、设备和存储介质-202010987456.7
  • 李磊;王明轩;董倩倩;赵程绮 - 北京字节跳动网络技术有限公司
  • 2020-09-18 - 2023-10-20 - G06F40/58
  • 本发明公开了一种语音翻译方法、装置、设备和存储介质。该方法包括:通过端到端语音翻译模型的编码器提取待处理语音的语义特征;通过所述端到端语音翻译模型的解码器,从所述语义特征中解码出对应的源语言文本;通过所述端到端语音翻译模型的解码器,根据所述源语言文本解码所述语义特征,得到对应的文本序列,所述文本序列包括所述源语言文本和所述源语言文本对应的目标语言文本;拆分所述文本序列,得到所述待处理语音对应的目标语言文本。该方法能够缓解解码器的解码压力以及改善解码器的解码性能,从而提高了端到端语音翻译模型的预测性能。
  • 一种训练翻译模型的方法和设备-202110264866.3
  • 陈巍华;孙见青;梁家恩 - 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司
  • 2021-03-12 - 2023-10-20 - G06F40/58
  • 本发明涉及一种训练翻译模型的方法和设备,该方法包括:获取多个单语种模型及多个单领域模型;对所有的单语种模型与所有的单领域模型分别进行裁剪,得到多个裁剪模型;对各裁剪模型中的有用分支的权值赋值为第一值,且对各裁剪模型中的无用分支的权值赋值为第二值,以得到各裁剪模型的Mask矩阵;汇总各Mask矩阵得到LDMask矩阵;对LDMask矩阵进行多语种与多领域的联合训练,得到多语种与多领域的翻译模型。本方案将模型裁剪引入到多语种、多领域的模型中,能有效的将与任务相关的权值和与任务不相关的权值分开,通过使用与任务相关的权值进行模型训练有效的提升该任务的效果,提升多语种、多领域的翻译效果。
  • 游戏译文版本的生成方法、装置、电子设备及存储介质-201911328735.6
  • 沈剑波;许辉;白井波;邱立业 - 腾讯科技(深圳)有限公司
  • 2019-12-20 - 2023-10-20 - G06F40/58
  • 本发明公开了游戏译文版本的生成方法、装置、电子设备及存储介质,所述方法包括:获取目标游戏的开发资源包;复制该开发资源包,生成临时资源包;遍历临时资源包中的临时源文件,在遍历时中执行以下步骤:提取临时源文件中属于目标语言的第一目标语句,生成第一目标语句对应的第一语句标识;确定翻译文件集中与临时源文件的文件类型相匹配的目标翻译文件;获取目标翻译文件中与第一语句标识相匹配的目标译文语句;将临时源文件中的第一目标语句替换为所述目标译文语句,得到临时译文文件;在遍历结束时,根据临时资源包中的临时译文文件生成目标游戏的译文版本。本发明有利于提高游戏出海本地化的效率。
  • 一种多领域神经网络在垂直领域微调的优化方法及系统-202010718332.9
  • 陈巍华 - 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司
  • 2020-07-23 - 2023-10-20 - G06F40/58
  • 本发明提供了一种多领域神经网络在垂直领域微调的优化方法及系统,所述方法执行以下步骤:训练基础领域模型;对所述基础领域模型进行裁剪,得到裁剪基础领域模型;基于裁剪基础领域模型,生成裁剪基础领域模型中每一层对应的mask矩阵;基于垂直领域数据和所述mask矩阵,对裁剪基础领域模型进行微调,得到具备垂直领域能力的多领域神经网络模型。根据本发明的方法,使用垂直领域数据和mask矩阵来微调裁剪基础网络中的无用分支,作为一种增量学习的方式,能够提升垂直领域的效果,这样最终得到的多领域模型具备基础领域模型的全部性能,同时具备处理垂直领域的能力,因此可以解决多领域神经网络在垂直领域微调后,在基础领域效果急剧下降的问题。
  • 基于Android系统的语音处理方法、系统及智慧屏、存储介质-202310765653.8
  • 甘年平 - 新华三智能终端有限公司
  • 2023-06-26 - 2023-10-17 - G06F40/58
  • 本申请提供了基于Android系统的语音处理方法、系统及智慧屏、存储介质,其中方法包括:获取语音数据;将获取到的语音数据传输到操作系统的系统层,通过系统层中的语音处理模块进行语音处理;将处理后的语音数据传输语音播放设备进行播放。本申请实施例语音处理模块设置于Android系统的系统层,不需要额外购买语音转化软件或设备,设备兼容性好且降低了用户的使用成本。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top