[发明专利]基于专利数据的半自动化翻译双语模板的构建方法及系统有效

专利信息
申请号: 201911064507.2 申请日: 2019-11-01
公开(公告)号: CN110826343B 公开(公告)日: 2022-02-08
发明(设计)人: 张孝飞;张迁;范婷婷;葛昱晖;诸敏刚 申请(专利权)人: 北京中献电子技术开发有限公司
主分类号: G06F40/42 分类号: G06F40/42;G06F16/35
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 鄢功军
地址: 100081 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 本发明涉及机器翻译技术领域,尤其涉及一种基于专利数据的半自动化翻译双语模板的构建方法及半自动化翻译系统;包括以下步骤:获取专利领域双语句对齐的双语语料;从双语语料筛选出翻译存在问题的双语句子;对双语句子进行拆分,聚类,形成双语数据库,从双语数据库中抽取常量和变量,建立翻译双语模板;对翻译双语模板进行过滤和人工校验,得到符合要求的合格翻译双语模板;通过专利数据的半自动化翻译双语模板的构建方法建立半自动化翻译系统以解决现有技术存在的对专利翻译模板精度差,翻译不准确的技术问题。
搜索关键词: 基于 专利 数据 半自动 翻译 双语 模板 构建 方法 系统
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中献电子技术开发有限公司,未经北京中献电子技术开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201911064507.2/,转载请声明来源钻瓜专利网。

同类专利
  • 信息处理方法及装置、电子设备、存储介质-202310872606.3
  • 刘杰 - 网易(杭州)网络有限公司
  • 2023-07-14 - 2023-10-24 - G06F40/42
  • 本申请提供了一种信息处理方法及装置、电子设备、存储介质,其中,方法包括:对至少一个待翻译文件进行解析,得到多个原文;对于每个原文,若全局翻译数据库中包含原文,则从全局翻译数据库中获取原文对应的译文,并将原文对应的待翻译文件的文件标识添加到全局翻译数据库中;其中,全局翻译数据库是根据已翻译文件的原文和译文以及文件标识生成;根据待翻译文件的原文对应的译文,生成与待翻译文件对应的已翻译文件;可以实现同时对多个待翻译文件进行翻译,提高翻译效率,并且,根据已翻译文件的原文和译文以及文件标识生成全局翻译数据库,基于全局数据库对待翻译文件进行翻译,可以节省开发制作成本。
  • 自然语言翻译模型训练和配置-202210336355.2
  • 黄广扬;黄进安;钟展超;汤思敏;唐志鸿 - 物流及供应链多元技术研发中心有限公司
  • 2022-03-31 - 2023-10-24 - G06F40/42
  • 一种用于训练自然语言翻译模型的计算机实现的方法。该计算机实现的方法包括:处理一组或多组电子并行文档,以获得多个对齐的并行句子;创建第一训练集,其包括多个对齐的并行句子的子集;以及在第一阶段中使用第一训练集训练自然语言翻译模型。该计算机实现的方法还包括:基于在第一阶段的训练后检测到的翻译错误修改第一训练集;基于修改后的第一训练集和不在第一训练集中的至少一些对齐的并行句子创建第二训练集;以及在第二阶段中使用第二训练集训练自然语言翻译模型,以提高自然语言翻译模型的翻译性能。
  • 一种英文地名翻译方法及装置-201910056128.2
  • 毛曦;颜闻;马维军;殷红梅;刘东琴 - 中国测绘科学研究院
  • 2019-01-21 - 2023-09-29 - G06F40/42
  • 本发明涉及一种英文地名翻译方法及装置,该方法包括:获取待翻译地名词组信息;根据地名词组信息区分地名专名部分和地名通名部分;根据地名专名部分进行音译,得到音译结果;结合音译结果和地名通名部分进行翻译,得到地名翻译结果。采用上述方法或装置能够自动完成英文地名翻译,减少地名生成时的人力消耗,提高翻译效率。
  • 一种数据处理方法及装置-201910469354.3
  • 李长亮;王怡然;郭馨泽;唐剑波 - 北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司
  • 2019-05-31 - 2023-09-26 - G06F40/42
  • 本申请提供一种数据处理方法及装置,用于解码器,所述解码器包括至少一个解码层;对于每个解码层,所述方法包括:根据输入的参考待解码向量进行自注意力计算,得到第一子层向量;将第一子层向量以及输入的编码向量进行多头注意力计算,得到第二子层向量;将所述参考待解码向量和所述第二子层向量进行融合,得到融合向量;将融合向量进行线性变换,得到输出的解码向量,从而实现高阶子层和低阶子层的向量融合,有效利用高阶子层蕴含的语义信息和低阶子层蕴含的语法信息,从而保证了模型翻译效果的有效提升。
  • 字幕敏感信息自动屏蔽转译方法和装置-202110416698.5
  • 杨雨薇 - 广州欢网科技有限责任公司
  • 2021-04-19 - 2023-09-15 - G06F40/42
  • 本申请涉及一种字幕敏感信息自动屏蔽转译方法和装置,其中该方法包括:首先获取字幕源文件,对源字幕文件进行解析,得到字幕解析结果;然后基于预设语义识别算法和字幕解析结果对字幕中的各台词进行关联度计算,判断字幕中词语的句义词义;通过预设语义识别算法以及上述步骤中确定的词义和语义,对字幕中词语和语句进行敏感度判断,确定敏感信息;最后将敏感信息用近义词代替,生成脱敏字幕。如此,通过本申请提供的字幕敏感信息自动屏蔽转译方法,可以实现自动识别敏感信息,并用近义词将敏感信息代替,从而实现将敏感信息自动屏蔽转译,解决了现有技术中,敏感信息的筛选和处理都需要人工处理,工作人员工作量大且处理速度慢的问题。
  • 融合XLM-R模型的机器翻译模型的训练方法-202110962199.6
  • 周玉;李茂西 - 北京中科凡语科技有限公司
  • 2021-08-20 - 2023-09-08 - G06F40/42
  • 本公开提供一种融合XLM‑R模型的机器翻译模型的训练方法,包括:获取训练集,训练集包括多组双语句子对;对训练集进行规范化处理;在XLM‑R模型的编码端,对训练集中的源端文本句子进行抽象表示,输入至XLM‑R模型,取出XLM‑R模型的最顶层的编码输出;在XLM‑R模型的解码端,对训练集中的目标端文本句子进行抽象表示,输入至XLM‑R模型,取出XLM‑R模型的最顶层的解码输出;将编码输出以及解码输出输入至神经翻译模型的编码器‑解码器融合层,对融合层的输出进行解码处理,获得源端文本句子的目标端译文句子;获得训练后的机器翻译模型。本公开还提供一种训练装置、翻译装置、电子设备及可读存储介质。
  • 模型训练方法、翻译方法及翻译系统-202310666692.2
  • 王轲;张金鹏;肖妮妮;张昱琪;赵宇 - 阿里巴巴(中国)有限公司
  • 2023-06-06 - 2023-09-01 - G06F40/42
  • 本申请提供一种模型训练方法、翻译方法及翻译系统。该模型训练方法包括:获取样本文本,样本文本为第一语言的文本;提取样本文本中的文本片段,并获取文本片段对应的多个翻译片段,翻译片段为文本片段的翻译结果,翻译片段为第二语言的文本;获取样本文本对应的标签文本,标签文本是样本文本的翻译结果,标签文本为第二语言的文本;采用样本文本、文本片段、多个翻译片段和标签文本训练翻译模型,样本文本、文本片段和多个翻译片段为翻译模型的输入,本申请能够训练得到翻译模型对文本进行准确的翻译。
  • 响应语句生成设备、方法和存储介质以及语音交互系统-201811417322.0
  • 渡部生圣 - 丰田自动车株式会社
  • 2018-11-26 - 2023-09-01 - G06F40/42
  • 为了通过鹦鹉学舌的方式生成包括针对用户的兴趣定制的内容的响应语句。响应语句生成设备包括:转换装置,用于将用户的输入语音转换成文本信息;提取装置,用于从输入语音中提取韵律信息;指定装置,用于基于文本信息和韵律信息来指定指示用户的情绪发生的情绪发生词语;以及生成装置,用于从文本信息中选择包括所指定的情绪发生词语的字符串并且通过对所选择的字符串执行预定处理来生成响应语句。
  • 基于人工智能的文本翻译方法、装置、计算机设备及介质-202310712757.2
  • 凌天东;王健宗;程宁 - 平安科技(深圳)有限公司
  • 2023-06-15 - 2023-08-29 - G06F40/42
  • 本发明涉及数字医疗技术领域,尤其涉及一种基于人工智能的文本翻译方法、装置、计算机设备及介质。该方法对文本样本和翻译标签遮挡,得到遮挡样本和遮挡标签,通过编码器提取遮挡样本的样本特征,将样本特征输入翻译解码器和重构解码器,得到翻译样本和重构样本,根据遮挡标签、文本样本、翻译样本和重构样本,训练编码器、翻译解码器和重构解码器,根据训练结果生成文本翻译模型和文本重构模型,根据生成的模型分别对遮挡样本处理根据处理得到的文本翻译结果和文本重构结果的关联程度,调整文本翻译模型的参数,得到目标翻译模型,提高文本翻译的准确率,提高医疗场景下为跨语种人员提供医疗服务的便捷性,进而提高跨语种人员的医疗服务体验。
  • 翻译模型训练方法、装置、计算机设备及存储介质-202210138704.X
  • 梁云龙;孟凡东;徐金安;陈钰枫 - 腾讯科技(深圳)有限公司;北京交通大学
  • 2022-02-15 - 2023-08-25 - G06F40/42
  • 本申请实施例公开了一种翻译模型训练方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取样本数据集合;调用待训练的翻译模型,基于第一历史语句,对第一样本语句进行翻译,得到第一样本语句对应的第一翻译语句,基于翻译模型的第一损失函数和第一翻译语句,确定第一梯度参数;调用辅助模型,基于样本数据集合中的辅助历史语句进行处理,得到辅助模型的输出结果,基于辅助模型的第二损失函数和辅助模型的输出结果,确定第二梯度参数;基于第一梯度参数和第二梯度参数,更新翻译模型对应的模型参数。该方法能够增强翻译模型所翻译出的翻译语句与位于该翻译语句之前的语句之间的连贯性,从而提高了翻译模型的准确性。
  • 一种语音翻译方法及系统-202010401772.1
  • 徐敏;肖龙源;李稀敏;蔡振华;刘晓葳;谭玉坤 - 厦门快商通科技股份有限公司
  • 2020-05-13 - 2023-08-22 - G06F40/42
  • 本发明公开了一种语音翻译方法及系统,包括以下步骤:构建小语种和普通话的可替换词列表;构建子词字典;对每个字符进行独热编码;获取待识别语音,提取语音特征;计算待识别语音特征的位置编码向量;将待识别语音特征和位置编码向量进行求和;将待识别输入向量输入训练好的语音翻译模型;语音翻译模型输出识别文本。本发明使得语音翻译模型的训练难度降低,训练速度提升。
  • 翻译训练数据生成方法、装置、计算机设备及存储介质-202010078640.X
  • 俞春龙 - 苏州交驰人工智能研究院有限公司
  • 2020-02-03 - 2023-08-18 - G06F40/42
  • 本发明实施例公开了一种翻译训练数据生成方法、装置、计算机设备及存储介质。所述方法包括:对预先训练的至少一个翻译模型进行翻译质量评估,确定满足翻译质量低条件的目标数据类型,各所述翻译模型通过初始训练语料训练得到;获取与所述目标数据类型匹配的目标训练语料,以对各所述翻译模型继续训练,所述目标训练语料与所述初始训练语料不同。本发明实施例可以提高翻译模型的翻译质量。
  • 一种法语地名机器翻译方法-202111122788.X
  • 毛曦;马维军;高武俊;王继周 - 中国测绘科学研究院
  • 2021-09-24 - 2023-07-21 - G06F40/42
  • 本发明公开一种法语地名机器翻译方法,方法包括:首先对预处理后的所述法语地名词组进行区分,获得地名通名部分和地名专名部分;其次将所述地名专名部分按照法汉音译表中字母组合进行翻译,获得专名音译结果;然后将所述地名通名部分按照法语通名所指的地理实体类别进行翻译,获得通名音译结果;最后将所述专名音译结果和所述通名音译结果进行整合,获得地名翻译结果。本发明公开的技术方案实现机器翻译,减少地名生成时的人力消耗,并提高了翻译法语地名的效率。
  • 分布式翻译方法、装置、电子设备及存储介质-202111545982.9
  • 姜政 - 语联网(武汉)信息技术有限公司
  • 2021-12-16 - 2023-06-20 - G06F40/42
  • 本发明提供一种分布式翻译方法、装置、电子设备及存储介质,分布式翻译方法,包括:获取翻译项目,并对所述翻译项目进行拆分,得到多个项目任务;将所述多个项目任务发送至对应的多个终端设备;接收所述终端设备返回的多个项目任务完成结果,并将所述多个项目任务完成结果进行存储。本发明提供的分布式翻译方法、装置、电子设备及存储介质,可以解决现有技术中翻译效率低,翻译消耗时间多的缺陷,实现提高翻译效率,降低翻译消耗的时间。
  • 数据翻译方法、装置、设备及计算机存储介质-202011167543.4
  • 梁军 - 深圳前海微众银行股份有限公司
  • 2020-10-27 - 2023-06-09 - G06F40/42
  • 本发明涉及金融科技(Fintech)技术领域,并公开了一种数据翻译方法,该方法包括:当检测到多个翻译算法被多个系统调用时,依次遍历被调用的各翻译算法,若遍历的翻译算法是获取字典翻译结果集,根据遍历的翻译算法确定数据传输对象对应的要素类型,并将要素类型添加至预设的翻译标记集合,以获取目标翻译标记集合;若目标翻译标记集合中存在和遍历的翻译算法对应的字典缓存组件不匹配的目标要素类型,则将目标要素类型添加至预设的翻译再标记集合;根据具有目标要素类型的翻译再标记集合远程调用数据字典服务获取目标翻译数据并输出。本发明还公开了一种数据翻译装置、设备和计算机存储介质。本发明提高了各个系统中数据翻译的一致性。
  • 一种面向XML文档的可配置神经机器翻译方法-201911324182.7
  • 杜权;刘兴宇 - 沈阳雅译网络技术有限公司
  • 2019-12-20 - 2023-06-02 - G06F40/42
  • 本发明公开一种面向XML文档的可配置神经机器翻译方法,步骤为:定义标签翻译策略;准备大量的双语对齐语料,使语义单元分布到训练语料中;将构造好的训练数据,预处理后送到神经机器翻译模型中进行训练,训练至收敛时保存模型文件;加载训练好的模型到解码器中;将标签翻译策略写入一个配置文件中;根据配置好的翻译策略,将输入源语经过解码前处理,将不同策略的标签替换成对应的语义单元,再进行分词操作后送入解码器获取翻译结果;解码器返回的翻译结果为含有特定语义单元的结果,将语义单元替换回事先存储的标签,得到完整的标签译文写出到XML文件。本发明方法提取文本翻译模型本身就认识标签的存在,能自主解码出带标签的译文。
  • 基于区块链的翻译文稿关键词修改溯源系统与方法-201911332753.1
  • 何征宇 - 传神语联网网络科技股份有限公司
  • 2019-12-23 - 2023-05-26 - G06F40/42
  • 本发明提出基于区块链的翻译文稿关键词修改溯源系统、基于所述系统实现的修改溯源方法、以及实现所述方法的分布式节点系统。所述系统包括外部提交终端、术语区块化节点生成系统以及区块链溯源系统,所述外部提交终端用于提交针对翻译文稿的关键词修改术语;所述术语区块化节点生成系统基于所述提交的关键词修改术语,生成区块链节点并加入到所述区块链溯源系统中,作为所述区块链溯源系统中的区块链的加入节点;所述区块链溯源系统基于所述区块链完成所述翻译文稿的关键词修改溯源;所述分布式节点系统包括所述的区块链系统中的各个数据链节点,用于识别翻译文稿的关键词修改从而实现修改溯源。
  • 语言翻译模型的训练方法及装置-202010307663.3
  • 陈巍华 - 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司
  • 2020-04-17 - 2023-05-26 - G06F40/42
  • 本发明是关于语言翻译模型的训练方法及装置。该方法包括:步骤A1,获取互为双语语料的源语料S1和目标语料T1,并根据源语料S1和目标语料T1构建二分类翻译网络M1,其中,二分类翻译网络M1具备判断任意源语句和目标语句是否互为翻译的能力;步骤A2,利用源语料P1,对初始源语言训练模型进行训练,获得目标源语言训练模型M2;步骤A3,根据二分类翻译网络M1、目标源语言训练模型M2和源语料S1,获得源语料S3和源语料S3对应的目标语料T2;步骤A4,根据源语料S1、目标语料T1、源语料S3和目标语料T2,获得语言翻译模型。通过本发明的技术方案,可对源语料进行扩充,从而得到资源丰富的互为双译的源语料和目标语料,进而获得翻译精度和准确度以及质量较高的语言翻译模型。
  • 一种基于GMM的机翻引擎测试方法与翻译工具包-201911161479.6
  • 何征宇;夏菲 - 语联网(武汉)信息技术有限公司
  • 2019-11-27 - 2023-05-16 - G06F40/42
  • 本发明提出一种基于GMM的机翻引擎测试方法与翻译工具包。所述测试方法使用基于Openkiwi的评测引擎;所述评测引擎包括基于句子级别的评测引擎和基于词语级别的评测引擎;基于句子级别评分数值以及词语级别评分数值,构建评测矩阵PN,基于所述评测矩阵PN的迭代计算结果,判断是否通过人工反馈输入接口输入人工反馈参数。本发明还提出一种包含评测引擎的翻译工具包,所述翻译工具包包含至少一个翻译工具,并内置所述的基于Openkiwi的评测引擎,从而实现所述测试方法。
  • 一种便携式智能指向型翻译装置-202010215556.8
  • 曾宪阳;杨红莉;杨降龙;褚南峰;张国玉;邱航 - 南京工程学院
  • 2020-03-24 - 2023-05-12 - G06F40/42
  • 本发明公开了一种便携式智能指向型翻译装置,包括本部语音收放模块和外部语音收放模块,其中,本部语音收放模块用于采集佩戴者的语音信号和播放对话者经翻译后的语音信号,外部语音收放模块用于采集非佩戴者的语音信号和播放佩戴者经翻译后的语音信号;本发明设有固定轴、固定球体和万向轴,万向轴内设有若干永久磁铁,固定球体内设有若干电磁铁。本发明可以代替人工翻译,让翻译变得的更加简单快捷;本发明具有智能指向功能,在对话过程中能够智能识别对话者的位置,通过永久磁铁与电磁铁的吸引力,使外部语音收放模块始终正对说话者,增强了语音采集的效果。
  • 一种基于离散型变量的神经机器翻译解码加速方法-202010068156.9
  • 杜权 - 沈阳雅译网络技术有限公司
  • 2020-01-21 - 2023-05-12 - G06F40/42
  • 本发明公开一种基于离散型变量的神经机器翻译解码加速方法,步骤为:构建训练平行语料及基于注意力机制的神经机器翻译模型,以训练收敛后的模型参数,作为基线系统;在基线系统中通过量化方法得到每个张量的缩放因子(scale),并为整个模型初始化一个统一的缩放因子(base_scale);对神经机器翻译模型;在进行加法运算之前,对来自不同操作的各自缩放因子,求得一个公共缩放因子,保证参数的量级一致;对神经机器翻译模型的输出进行反量化,将模型输出结果送到归一化函数中,并得到最终的翻译结果。本发明利用定点数的运算复杂度低这种天然的优势,在快速推理的最新实现基础上,模型性能没有下降的前提下,提升实时相应速度。
  • 一种基于离散型注意力机制的神经机器翻译解码加速方法-201911323661.7
  • 杜权 - 沈阳雅译网络技术有限公司
  • 2019-12-20 - 2023-05-09 - G06F40/42
  • 本发明公开一种基于离散型注意力机制的神经机器翻译解码加速方法,步骤为:构建训练平行语料及基于注意力机制的神经机器翻译的模型,利用平行语料生成机器翻译词表,进一步训练得到训练收敛后的模型参数,作为基线系统;通过对模型参数数值的缩放将网络中注意力机制部分参数转换为整型数值,将浮点数映射到整型数值的整型区间内;无法用整型计算的归一化部分替换为有利于整型计算的线性结构;在线性结构之前通过阈值来控制是否所有数值均参与运算;通过在训练数据中随机抽取的1%~2%的数据上调整所选取的阈值,使其能够达到更好的翻译结果。本发明能够在快速推理的最新实现基础上,且在模型性能几乎没有下降的前提下,提升实时相应速度。
  • 数据生成方法、装置、电子设备和存储介质-202310026051.0
  • 伍星;林梓佳 - 北京达佳互联信息技术有限公司
  • 2023-01-09 - 2023-04-18 - G06F40/42
  • 本公开关于一种数据生成方法、装置、电子设备、存储介质,所述方法包括:获取原始数据集合,以及基于原始数据集合得到的扩增数据集合;根据每个原始数据进行语言转换后的原始转译数据,得到原始转译数据集合,以及根据每个扩增数据进行语言转换后的扩增转译数据,得到扩增转译数据集合;根据原始转译数据集合和扩增转译数据集合,确定多个转译数据对;从多个转译数据对中确定出至少一个目标转译数据对;每个目标转译数据对中的两个转译数据的语义相似度大于或等于预设相似度阈值;基于至少一个目标转译数据对,从原始数据集合和扩增数据集合中,筛选出至少一个目标数据对。采用本方法能够实现可控的数据增强,提升了数据增强效果。
  • 文本翻译方法、装置、设备及存储介质-202211326580.4
  • 徐玲芳;郭宇航 - 恒生电子股份有限公司
  • 2022-10-27 - 2023-04-11 - G06F40/42
  • 本申请提供了一种文本翻译方法、装置、设备及存储介质,该方法包括:提取待处理项目页面的原始页面显示代码中的第一语种文本,将第一语种文本存储至预设对象,并根据第一语种文本、第一语种文本和预设对象之间的映射关系,生成第一语种文件,将第一语种文件中第一语种文本翻译为第二语种文本,生成第二语种文件,将原始页面显示代码中的第一语种文本替换为调用函数,生成目标显示代码,以使目标显示代码运行时,基于调用函数的入参值调用显示第一语种文件中的第一语种文本或第二语种文件中的第二语种文本。自动化提取替换代码中的文本,防止替换遗漏,提高了提取效率,结合对象名称翻译文本,提高了翻译准确度和效率,降低了沟通成本。
  • 翻译的方法和装置-201911316920.3
  • 张传强;张睿卿;熊皓;何中军;吴华;李芝;王海峰 - 北京百度网讯科技有限公司
  • 2019-12-19 - 2023-04-07 - G06F40/42
  • 本公开实施例公开了翻译的方法和装置。方法采用翻译模型,翻译模型包括编码器、分类器和解码器,方法包括:将基于第一文本的分词序列确定的向量矩阵输入编码器,得到编码器输出的中间表示;将中间表示输入分类器,得到分类器输出的分类标签;响应于分类标签指示第一文本的分词序列中位于尾部的分词为独立的翻译单元,将中间表示输入解码器,得到解码器输出的第二文本。该方法使得翻译质量得到保证的情况下降低系统耗时,并且,在现有的翻译模型的基础上容易进行改进,使用简单且引入有监督的学习来实现了翻译单元的控制。
  • 语言翻译处理模型训练方法和语言翻译处理方法-202010743766.4
  • 肖嵘 - 中国平安财产保险股份有限公司
  • 2020-07-29 - 2023-04-07 - G06F40/42
  • 本发明实施例提供一种语言翻译处理模型训练方法,包括对样本语言文本执行向量转化,以得到多个样本分词数据对应的样本分词向量及位置向量;随机初始化转换神经网络模型中的权重参数;基于第一约束条件和第二约束条件,得到约束后的权重参数;根据样本分词向量、位置向量、约束后的权重参数计算样本注意力分值,并得到目标样本翻译语言文本;当目标样本翻译语言文本与样本语言文本对应的样本翻译语言文本不一致时,调整模型的约束后的权重参数,以得到训练后的语言翻译处理模型。本发明实施例提供语言翻译处理方法。本发明实施例的模型训练方法对权重参数增加约束条件,提升模型优化的速度,提高模型训练的稳定性。
  • 一种智能家居线性时序逻辑规约生成的方法和装置-201910935932.8
  • 卜磊;翟娟;张时雨;张秋萍;赵建华;李宣东 - 南京大学
  • 2019-09-29 - 2023-03-24 - G06F40/42
  • 本发明公开了一种智能家居线性时序逻辑规约生成的方法和装置,用于在智能家居领域中将用户输入的自然语言需求文本转换成线性时序逻辑规约。该方法首先对输入的自然语言文本进行预处理;然后使用自然语言处理技术,生成语法分析树和语法依存关系;识别句子中的各个子句,以及每个子句中的主语、谓语、宾语、布尔运算符、条件变量和时序运算符,生成树形的中间表示形式;最后遍历树结构,自动生成对应的线性时序逻辑规约。本发明解决了普通智能家居用户难以直接提供形式化规约的问题,有效节约时间和人力成本,并且能够弥补现有智能家居物联网验证系统的不足,使得不具备专业知识的普通用户所提出的自然语言需求能够被自动的验证。
  • 语言翻译模型的训练方法、翻译方法、装置和电子设备-202011114707.7
  • 孙泽维;王明轩;李磊 - 北京有竹居网络技术有限公司
  • 2020-10-16 - 2023-03-24 - G06F40/42
  • 本公开实施例公开了语言翻译模型的训练方法、翻译方法、装置和电子设备。该语言翻译模型的训练方法的一具体实施方式包括:获取训练样本集合,所述训练样本集合包括多个训练样本;对于每一个训练样本,确定该训练样本的第一集合,所述第一集合包括该训练样本以及至少一个拆分结果,所述拆分结果是对该训练样本拆分得到;使用多个训练样本对各自对应的第一集合对初始语言训练模型进行训练,得到训练后的语言翻译模型。由于训练样本的第一集合中包括训练样本和训练样本的拆分结果,使用上述方法得到的语言翻译模型翻译文档时,所得到的翻译文档的准确度和一致性较高。
  • 内容翻译方法、智能终端及存储介质-202211561574.7
  • 徐鑫 - 上海传英信息技术有限公司
  • 2022-12-07 - 2023-03-17 - G06F40/42
  • 本申请提出了一种内容翻译方法、智能终端及存储介质,内容翻译方法可应用于智能终端,包括以下步骤:根据定位信息和/或待译内容确定可选语言;响应于第一界面的第一操作确定至少一个目标语言;基于所述待译内容以及所述目标语言,确定或生成译文内容。本申请提高了待译内容翻译的效率和/或准确度。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top