[发明专利]翻译评估模型的训练方法、翻译评估方法、设备及介质在审

专利信息
申请号: 202210200248.7 申请日: 2022-03-02
公开(公告)号: CN114580437A 公开(公告)日: 2022-06-03
发明(设计)人: 万宇;刘大一恒;杨宝嵩;张海波;陈博兴;谢军 申请(专利权)人: 阿里巴巴(中国)有限公司
主分类号: G06F40/51 分类号: G06F40/51;G06F40/58;G06K9/62
代理公司: 北京同钧律师事务所 16037 代理人: 李小波;许怀远
地址: 310056 浙江省杭州市滨江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请提供一种翻译评估模型的训练方法、翻译评估方法、设备及介质,该翻译评估模型的训练方法包括:获取训练样本集及其中各个训练文本对的标识信息,其中,所述训练文本对包括译文和至少一种类型的参照信息,所述参照信息包括原文和参考译文中的至少一项,标识信息用于指示训练文本对中参照信息的类型;根据所述训练样本集其中各个训练文本对的标识信息,对翻译评估模型进行训练,得到训练后的翻译评估模型,实现了通过统一模型框架进行多种输入场景下的译文评估,提高了翻译评估的便捷性,以及提高了翻译评估模型的应用范围和灵活性。
搜索关键词: 翻译 评估 模型 训练 方法 设备 介质
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202210200248.7/,转载请声明来源钻瓜专利网。

同类专利
  • 一种机翻译文细粒度错误类型识别和定位方法-202310863738.X
  • 潘丽婷;陈件;张井 - 上海一者信息科技有限公司
  • 2023-07-14 - 2023-10-27 - G06F40/51
  • 本发明公开了一种机翻译文细粒度错误类型识别和定位方法,涉及机器翻译识别技术领域,其技术方案要点是一种机翻译文细粒度错误类型识别方法,所述识别方法采用细粒度评估,能够帮助译者更好地定位和修改译文错误。因此,将细粒度错误类型预测视为一种文本序列标注任务,输入原文和机翻译文,通过双塔编码器获取原文和译文文本特征,利用交叉编码器获取原文和译文之间的交叉特征,最后能够输出机翻译文的单词级别错误类型,从而便于使用者快速找出机翻译文的错误类型和错误位置。解决了传统的粗粒度评估方式,只对机翻译文的整体评估,需要译者自行查找错误位置,因此在使用的过程中存在不便利的问题。
  • 一种基于编辑距离和编辑时间的译后编辑工作量评估方法-202310094053.3
  • 李梅;潘丽婷;陈件;张井 - 李梅;上海一者信息科技有限公司
  • 2023-02-03 - 2023-10-27 - G06F40/51
  • 本发明公开了一种基于编辑距离和编辑时间的译后编辑工作量评估方法,涉及智能评估技术领域,包括以下步骤:文本特征拼接、文本特征分词、获取单词向量表征、构造一个6层12头自注意力层的编码器、获取句子级别隐藏向量和预测译后编辑时间和编辑距离。效果是预测出所需要的编辑时间和编辑距离,用户可以根据编辑时间和编辑距离统筹分配译后编辑工作,对于编辑距离大,编辑时间长的机翻译文投入较多精力,对于编辑距离小,编辑时间短的机翻译文投入较少精力,有利于提高译后编辑工作效率,同时为译后编辑工作计价提供参考。
  • 一种基于自然语言大模型的翻译文本质量评估方法及系统-202310814686.7
  • 王艾;林孟阳;阮自辉 - 中国民用航空飞行学院
  • 2023-07-05 - 2023-09-26 - G06F40/51
  • 本发明公开了一种基于自然语言大模型的翻译文本质量评估方法及系统,涉及自然语言处理技术领域,通过构建民航领域数据集,选择GPT‑4模型为基础模型,定义客观评估指标;通过对GPT‑4模型进行Finetune训练,得到用于评估的迁移模型,再根据性能表现对其进行调整,最后对调整后的迁移模型进行性能测试,应用测试后的迁移模型对民航英语翻译文本进行质量评价。本发明建立的迁移模型的泛化能力强,能够充分利用其迁移学习能力,提高翻译质量评估的准确性和可靠性;能从专业的角度评估翻译结果的准确性、流畅性、专业性和安全性,可广泛应用于民航英语及其他专业领域的翻译质量评估,实现自动化、客观、高效的评价。
  • 翻译质量评估方法、装置、电子设备和存储介质-202310931020.X
  • 王玮;汪洋;苏文畅;李沫;徐磊 - 安徽听见科技有限公司
  • 2023-07-25 - 2023-09-05 - G06F40/51
  • 本发明提供一种翻译质量评估方法、装置、电子设备和存储介质,其中方法包括:获取待评估文档和参考文档,待评估文档和参考文档为对同一源语种文档向同一目标语种翻译所得;基于参考文档中各模态下的参考片段,对待评估文档中各模态下的待评估片段,进行与各模态对应的片段翻译评估,得到待评估片段的片段评估结果;基于片段评估结果,确定待评估文档的翻译质量评估结果。本发明提供的方法、装置,提升了翻译质量评估的准确性和效率,实现了去人工化、评估结果一致,并且适用场景和规模广泛的翻译质量评估。并且,方便对翻译质量评估结果进行分析,利于技术人员识别翻译薄弱点,进而有利于翻译质量的持续优化改进。
  • 一种车机文字翻译的检查方法-201911324452.4
  • 阚叶明 - 常州新途软件有限公司
  • 2019-12-20 - 2023-08-29 - G06F40/51
  • 本发明提供了一种车机文字翻译的检查方法,包括以下步骤:S1、翻译检查工具根据外部输入录入翻译对照表,所述翻译对照表包括文字大小、文本框宽度和语言名称;S2、所述翻译检查工具根据外部输入获录入译文;S3、所述翻译检查工具获取所述文字大小和文本框宽度;S4、根据行文字个数和字数阈值判断判断文字是否越界;S5、根据文本占比和标准阈值判断文字是否越界;S6、进行下一行译文的判断。这种车机文字翻译的检查方法通过数字阈值对译文进行初步判断,减少了翻译检查工具的计算量和检查时间;同时能够让检测人员通过文本占比直观的了解文字的越界情况。
  • 机器翻译译文质量评估方法及装置-202310098818.0
  • 闫泽禹 - 传神语联网网络科技股份有限公司
  • 2023-01-28 - 2023-08-22 - G06F40/51
  • 本发明提供一种机器翻译译文质量评估方法及装置,所述方法包括:获取对目标原文进行机器翻译所得到的目标译文;确定所述目标译文与所述目标原文的相似度特征;确定所述目标译文的语法错误特征;确定所述目标原文的第一流畅度特征;确定所述目标译文的第二流畅度特征;基于所述相似度特征、所述语法错误特征、所述第一流畅度特征和所述第二流畅度特征,确定所述目标译文的预测质量等级。本发明的机器翻译译文质量评估方法,通过从原文与译文之间相似度、译文的语法错误、原文以及译文的流畅度这些维度来对机器翻译得到的目标译文进行质量评价,能够更加全面并准确地对机器翻译译文进行质量评估。
  • 一种基于神经网络结构搜索的机器翻译译文质量评估方法-202110414498.6
  • 杜权 - 沈阳雅译网络技术有限公司
  • 2021-04-16 - 2023-08-15 - G06F40/51
  • 本发明公开一种基于神经网络结构搜索的机器翻译译文质量评估方法,步骤为:获取WMT质量评估任务的训练数据和WMT机器翻译任务中的训练数据;确定预测器‑评估器模型中的预测器组件,使用基于进化算法的搜索策略进行预搜索;搭建经典的预测器‑评估器模型,实行基于进化算法的搜索策略的最初使用Transformer神经机器翻译模型来热启动初始化种群;使用基于进化算法的搜索策略进行预搜索;对预测器部分的网络结构进行微调及训练调优;使用完整模型进行质量评估的单词级任务,并使用其在测试集上的准确度表征模型性能。本发明利用网络结构搜索技术,针对质量评估的任务和数据特性为预测器组件量身定制网络结构。
  • 一种翻译质量评价方法及装置-201810898744.8
  • 宋雪洁;宋明;田定书;刘俊华 - 科大讯飞股份有限公司
  • 2018-08-08 - 2023-07-28 - G06F40/51
  • 本申请公开了一种翻译质量评价方法及装置,该方法包括:在获取到对给定文本进行正确翻译后的参考翻译文本后,将其按照预设文本单位进行切分,得到各个参考单位文本,然后确定每一参考单位文本在该参考翻译文本中的重要度,接着,关于对给定文本进行翻译后的待评价文本即目标翻译文本,便可以根据每一参考单位文本对应的重要度,确定出目标翻译文本的翻译质量。可见,本申请不再只进行目标翻译文本与参考翻译文本中词语的遍历式匹配,而是根据该参考翻译文本中每一参考单位文本对应的重要度,确定出目标翻译文本的翻译质量,即,在进行翻译质量评价时考虑了参考翻译文本中每一词语本身的内容,从而提高了翻译质量评价结果的可信度。
  • 一种文本评估方法、装置、电子设备和存储介质-202111649387.X
  • 严渊蒙;杨振;孟凡东 - 腾讯科技(深圳)有限公司
  • 2021-12-30 - 2023-07-14 - G06F40/51
  • 本申请涉及计算机技术领域,尤其涉及一种文本评估方法、装置、电子设备和存储介质,用以提高机器翻译文本的质量评估准确率。其中,方法包括:获取对原文文本进行机器翻译得到的待评估文本,及对应的标准翻译文本;将待评估文本中的候选待评估短语,与标准翻译文本中的标准短语进行短语对齐,获得候选待评估短语对应的标准短语;将候选待评估短语中的至少一个目标待评估短语,替换为对应的标准短语,并确定替换前后待评估文本的困惑度变化量;基于各困惑度变化量,确定目标待评估短语的目标标签。由于本申请基于目标待评估短语被替换前后待评估文本的困惑度变换量,确定目标待评估短语的目标标签,能够有效提高对机器翻译文本的质量评估准确率。
  • 翻译处理方法及装置-201811350498.9
  • 陈小帅 - 抖音视界有限公司
  • 2018-11-14 - 2023-06-30 - G06F40/51
  • 本公开提出了一种翻译处理方法及装置,其中,方法包括:获取待翻译内容,并提取待翻译内容的语言特征;将语言特征输入到预先训练的错误识别模型中进行处理,获取待翻译内容的识别结果;根据识别结果判断待翻译内容是否存在错误,若存在,则对待翻译内容进行纠正生成纠正结果;对纠正结果进行翻译,获取对应的第一翻译结果并展示。由此,通过错误识别模型识别待翻译内容中的错误并进行纠正,进而对纠正结果进行翻译,使用户不用手动修正待翻译内容就能获取期望的翻译结果,提高了用户使用翻译工具的效率,提升用户的使用体验。
  • 机器翻译质量评估方法、装置、设备及存储介质-202310313254.8
  • 黄书剑;闫艺铭;戴新宇;张建兵;陈家骏 - 南京大学
  • 2023-03-28 - 2023-06-23 - G06F40/51
  • 本发明公开了机器翻译质量评估方法、装置、设备及存储介质,其中方法包括获取所评估语言对的双语平行语料,其中双语平行语料包括源语句和目标语句;基于获取的双语平行语料生成有对比性质的伪数据,伪数据包括一个与源语句部分词汇不同的伪源语句、伪源语句的翻译句标签;使用伪数据对预置的质量评估模型进行对比预训练;调用对比预训练后的质量评估模型对译文进行质量评分。增大机器翻译质量评估模型对源端的依赖,提高鲁棒性。
  • 基于重复句检测的翻译质量预警方法及其系统-201811194428.9
  • 郑丽华 - 传神语联网网络科技股份有限公司
  • 2018-10-16 - 2023-06-16 - G06F40/51
  • 本发明提供了一种基于重复句检测的翻译质量预警方法与系统。基于检测到的重复句,对当前翻译人员进行提前预警提示,从而在翻译阶段就能保证重复句的翻译一致性。采用本发明,翻译员只需要关注于当前翻译工作本身,而不需要分心担忧自己的翻译结果是否与他人一致。本发明的技术方案能够自动检测重复句并判断是否存在翻译质量问题从而提出预警提示;在预警提示发出后,还可以给出相应的校正结果,保持所有重复句的翻译结果统一性;该过程可以通过计算机自动替换完成。
  • 生成翻译模型的方法和装置-201911264427.1
  • 曲宇涛;张睿卿;熊皓;何中军;李芝 - 北京百度网讯科技有限公司
  • 2019-12-11 - 2023-06-02 - G06F40/51
  • 本公开的实施例公开了生成翻译模型的方法和装置。该方法的一具体实施方式包括:获取原始语料对集,其中,每个原始语料对包括待翻译语句和译文;对于原始语料对集中的原始语料对,将该原始语料对的待翻译语句切词,并至少一次随机编辑待翻译语句中的词语后,生成至少一个新语料,并与该原始语料对的译文组成至少一个新语料对;利用预先训练的初始翻译模型计算各新语料对的翻译得分;对于原始语料对集中的原始语料对,将基于该原始语料对生成的至少一个新语料对中翻译得分最高,且翻译得分高于预定阈值的新语料对确定为口语化语料对;使用口语化语料对训练初始翻译模型,得到口语化翻译模型。该实施方式提高了翻译系统针对口语化问题的鲁棒性。
  • 翻译内容检查方法、装置、系统及计算机设备-201810366778.2
  • 张通人;梅维一;严明;魏学峰 - 深圳市腾讯网络信息技术有限公司
  • 2018-04-23 - 2023-05-30 - G06F40/51
  • 本发明实施例公开了一种翻译内容检查方法、装置、系统及计算机设备,其中翻译内容检查方法包括:获取终端上传的应用的翻译文件,所述翻译文件中包括多个索引项,每个索引项中包括源字符串字段和翻译字符串字段;基于所述源字符串字段和翻译字符串字段,对所述多个索引项进行扫描检查,找出问题项;为所述问题项生成对应的问题描述项;根据所述问题描述项生成问题列表。本发明实施例能够避免人工检查出现的检查不全、遗漏等问题,提高了检查效率。
  • 一种中外文信息对比方法及装置-201910750275.X
  • 朱昆;刘超 - 交控科技股份有限公司
  • 2019-08-14 - 2023-05-26 - G06F40/51
  • 本发明实施例提供一种中外文信息对比方法及装置,所述方法包括:提取与源文件和目标文件分别对应的中文关键字信息和外文关键字信息;所述源文件为中文文件、所述目标文件为外文文件;所述源文件和所述目标文件具有同一文件类型;获取与所述外文关键字信息相对应的中文翻译信息,并将所述中文翻译信息与所述中文关键字信息进行对比。所述装置执行上述方法。本发明实施例提供的中外文信息对比方法及装置,通过提取中文关键字信息和外文关键字信息,将与外文关键字信息相对应的中文翻译信息与中文关键字信息进行对比,对比的对象是关键字信息,能够快速查找源目标文件的不同之处,从而能够高效地实现中外文信息对比。
  • 基于人工智能的口译自动测评系统-202310175076.7
  • 张放;陈敏;吴静 - 东莞理工学院
  • 2023-02-28 - 2023-05-23 - G06F40/51
  • 本发明公开了基于人工智能的口译自动测评系统,包括收纳箱、电动伸缩杆、口译设备本体、密封装置和移动装置,所述收纳箱上端为开口设置,所述电动伸缩杆设于收纳箱内底壁上,所述口译设备本体设于电动伸缩杆的自由端上,所述密封装置设于收纳箱内,所述收纳箱底壁上设有脚柱,所述脚柱上设有支撑板,所述移动装置设于支撑板上。本发明新型涉及电子产品技术领域,具体为基于人工智能的口译自动测评系统。
  • 基于OpenKiWi的翻译引擎自动化评测系统-201911160865.3
  • 刘国 - 语联网(武汉)信息技术有限公司
  • 2019-11-27 - 2023-05-16 - G06F40/51
  • 本发明提出一种基于OpenKiWi的翻译引擎自动化评测系统,所述自动化评测系统包括基于句子级别的评测引擎以及基于词语级别的评测引擎,通过评测不同翻译引擎在不同级别上翻译结果的相似性和差异性,从而输出对应的评测得分;本发明还提出一种集成化评测引擎,所述集成化评测引擎包括基于词语级别的第一评测引擎以及基于句子级别的第二评测引擎,所述第一评测引擎包含预测器,第二评测引擎包括评估器;所述集成化评测引擎对外提供通信接口,通过所述通信接口与基于OpenKiWi的翻译引擎通信,并对所述翻译引擎的翻译结果进行评测。
  • 应用文本的处理方法、装置、电子设备及存储介质-202310100217.9
  • 沈佳波;穆言;王吉康 - 网易(杭州)网络有限公司
  • 2023-02-06 - 2023-04-25 - G06F40/51
  • 本发明实施例提供了一种应用文本的处理方法、装置、电子设备及存储介质,所述方法包括:获取应用工程文件中各个文本节点对应的文本内容,所述文本节点包括配置有自适应文本框的目标文本节点;对各个所述文本节点对应的文本内容进行翻译,获得所述文本内容对应的翻译内容,并获取所述目标文本节点对应的翻译内容的文本特征;根据所述自适应文本框对应的检测条件与所述文本特征对所述翻译内容进行文本格式检测,若所述检测结果为所述翻译内容与所述自适应文本框不适配,则根据所述自适应文本框对应的文本框特征与所述检测条件,生成针对不适配所述自适应文本框的翻译内容的推荐格式。
  • 多语种机器翻译质量评估方法、模型、设备及存储介质-202211640692.7
  • 张为泰;叶忠义;刘俊华;杜俊 - 中国科学技术大学
  • 2022-12-20 - 2023-04-11 - G06F40/51
  • 本发明公开一种多语种机器翻译质量评估方法、模型、设备及存储介质,方法包括:步骤1,利用预训练好的多语言语义编码器对给定平行句对的源语言和目标语言进行同一语义编码;步骤2,利用预先经层次化半监督质量评估训练及质量评估正反一致性联合训练好的多语种机器翻译质量评估模型对同一语义编码通过交叉注意力层来进行源与目标语言交互;步骤3,对交叉注意力层的输出通过全连接层进行信息交互和非线性化激活在CLS标签位置经sigmoid函数处理,以处理结果作为质量评估结果。通过用多语言语义编码统一建模,同时建模质量评估与多语言语种间相似性;用训练好的质量评估模型,解决了资源稀缺场景下模型可用性问题,也提高了评估效果一致性。
  • 面向翻译译文的自动评分方法及自动评分系统-201910904087.8
  • 周玉 - 北京中科凡语科技有限公司
  • 2019-09-24 - 2023-04-07 - G06F40/51
  • 本发明提供一种面向翻译译文的自动评分方法及自动评分系统,包括:对各个训练译文、测试译文和标准译文均进行文本预处理;对预处理后的训练译文进行特征抽取,得到训练译文X维度特征得分;将N个训练译文作为训练样本,将每个训练译文的训练译文X维度特征得分作为X个输入,将训练译文的最终得分作为输出,分别训练神经网络模型、K‑最小近邻算法模型和支持向量机算法模型;将测试译文X维度特征得分输入训练好的模型,得到测试译文的最终得分。本发明提供的面向翻译译文的自动评分方法及自动评分系统,能够对翻译译文进行自动打分,显著提升评分的效率,减少评分人员的负担。
  • 视频内容的翻译方法、装置、设备及计算机可读介质-202010151582.9
  • 王晓晖;杜育璋;王明轩;李磊 - 北京字节跳动网络技术有限公司
  • 2020-03-06 - 2023-04-07 - G06F40/51
  • 本公开实施例公开了一种视频内容的翻译方法、装置、设备及计算机可读介质。包括:获取视频的网络测评参数,将网络测评参数满足设定条件的视频确定为目标视频;将所述目标视频的内容文本或者所述内容文本的机器翻译文本发送至翻译人员;接收翻译人员返回的所述内容文本的翻译文本或者所述机器翻译文本的校正文本。对网络测评参数满足设定条件的视频进行人工翻译或者人工校正,可以保证对目标视频翻译的准确性,同时无需对所有的视频进行人工翻译,可以极大的降低人力成本。
  • 字符校验方法、装置、计算机设备及计算机可读存储介质-202011247144.9
  • 钱强;田野;何世伟 - 成都安易迅科技有限公司
  • 2020-11-10 - 2023-03-24 - G06F40/51
  • 本申请公开了一种字符校验方法、装置、计算机设备及计算机可读存储介质,涉及互联网技术领域,按照标准字符列表,在语言配置文件中提取多个待校验字符,生成待校验列表,将标准字符列表和待校验列表比对以及标记,实现了自动比对校验,保证覆盖到所有界面,提高了效率,降低了误差以及失败的风险。所述方法包括:提取待校验应用的语言配置文件;按照标准字符列表包括的多个预设单键,在语言配置文件中提取多个待校验字符,生成待校验列表;基于多个预设单键,将待校验列表与标准字符列表进行比对;当在待校验列表中确定存在目标待校验字符时,查询目标待校验字符的差异类型,在待校验列表中采用差异类型对应的标记方式对目标待校验字符进行标注。
  • 翻译质量的分析方法、装置、设备、介质及程序产品-202211516248.4
  • 涂洋 - 传神语联网网络科技股份有限公司
  • 2022-11-29 - 2023-03-03 - G06F40/51
  • 本发明提供一种翻译质量的分析方法、装置、设备、介质及程序产品,涉及信息处理技术领域,该方法包括:获取翻译任务信息,所述翻译任务信息包括:机翻译文、所述机翻译文的第一修改标记信息、译后翻译译文、所述译后翻译译文的第二修改标记信息和标准译文中的至少一项;根据所述机翻译文和所述标准译文的第一相似度,确定所述翻译任务信息的修改标记质量信息;根据所述译后翻译译文、所述标准译文的第二相似度和所述第二修改标记信息,确定所述翻译任务信息的译后翻译质量信息;根据所述译后翻译质量信息和所述修改标记质量信息确定所述翻译任务信息对应的翻译质量信息。
  • 一种英语翻译测试系统-201911250455.8
  • 阳月霞;宋雅雯;张超 - 郑州航空工业管理学院
  • 2019-12-09 - 2023-02-24 - G06F40/51
  • 本发明公开了一种英语翻译测试系统,包括:单词选择模块、单词数据库、单词字母检测模块、初始化模块、单词延续模块、单词确定模块、显示确定模块、用户录入模块、测试评定模块以及用户提示模块。本发明依次随机选出设定数量的英语单词,并将以阵列的形式将单词字母数的空格显示出来,同时在下方显示出要写出的单词的汉语,待学生将单词填入对学生填写的单词进行判断,得到学生的测试成绩;通过单词中字母的个数显示输入框的个数,且每一个输入框只能输入一个单词,这样可以降低学生写单词的难度;以阵列的格式将单词进行写入,打破传统的单词撰写方式,在测试了单词的同时,增加了学生测试的趣味,使得学生在后期单词的学习中更加的有兴趣。
  • 一种翻译评价的方法、装置、存储介质及电子设备-201910517820.0
  • 王强;王永杰;李若冰 - 上海流利说信息技术有限公司
  • 2019-06-14 - 2022-12-30 - G06F40/51
  • 本发明提供了一种翻译评价的方法、装置、存储介质及电子设备,其中,该方法包括:获取源语言的原始文本,以及用户输入的目标语言的翻译文本;根据原始文本生成目标语言的多个参考文本;确定翻译文本与参考文本之间的多元相似值,并将与最大的多元相似值相对应的参考文本作为有效参考文本;提取翻译文本的特征信息,将特征信息作为预设的评价模型的输入,基于评价模型确定翻译文本的评价值。通过本发明实施例提供的翻译评价的方法、装置、存储介质及电子设备,基于多元相似值可以更加准确地确定翻译文本与参考文本之间的相似度;通过多个参考文本来对用户输入的翻译文本进行评价,评价结果可以更加准确。
  • 一种多特征融合的句子级译文质量估计方法-201910914342.7
  • 叶娜;王远远;蔡东风 - 沈阳航空航天大学
  • 2019-09-26 - 2022-12-27 - G06F40/51
  • 本发明公开一种多特征融合的句子级译文质量估计方法,包括以下步骤:1)并行提取词预测特征、语境化词嵌入特征、依存句法特征以及基线特征;2)上述特征提取后,分别对各特征进行进一步整合,针对特征向量采用将各特征由Bi‑LSTM层编码后的最后一个隐状态直接相加的方式和将各个向量按指定维度拼接的方式进行融合;3)通过上述两种融合方式得到两种高维向量,利用sigmoid函数进行最终的HTER值即译文质量分数预测。本发明采用更有效的上下文敏感的语言表示模型进行建模,提出一种融入语境化词嵌入特征的方法,将其与词预测特征相结合,并显性地融入了依存句法特征和17个基线特征,构建了一个多特征融合的译文质量估计模型。
  • 一种翻译纠错方法、装置和用于翻译纠错的装置-201710954922.X
  • 赵涵思;马浩;章哲 - 北京搜狗科技发展有限公司
  • 2017-10-13 - 2022-11-18 - G06F40/51
  • 本发明实施例提供了一种翻译纠错方法、装置和用于翻译纠错的装置。其中的方法具体包括:对图片中的对象对应的识别文本进行纠错,以得到纠错文本;根据所述纠错文本对应的翻译结果,对所述图片对应的翻译结果界面中所述对象对应的翻译结果进行更新;其中,所述翻译结果界面包括:所述图片中的对象以及所述对象对应的翻译结果;或者,所述图片中的对象对应的识别文本以及所述识别文本对应的翻译结果。本发明实施例可以节省翻译纠错的成本,且可以提高纠错效率。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top