“张为泰”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果33个，建议您升级VIP下载更多相关专利

[发明专利]机器同声传译系统、方法、测试方法、装置及相关设备-CN202310565696.1在审
发明人： 张为泰;刘俊华;王士进;胡国平 -专利权人：科大讯飞（上海）科技有限公司
申请日： 2023-05-18 - 公布日： 2023-10-24 - 主分类号： G10L15/26 文献下载
摘要：本申请提供了一种机器同声传译系统、方法、测试方法、装置及相关设备，系统及方法提供了多模态输出的功能，可以包括翻译文本的字幕输出、合成音频流的播放以及音频流与虚拟人合成的视频播放中的至少一项，本申请统筹考虑多个不同的影响同声传译质量的因素，示例如从BLEU分、忠实度、流利度角度衡量的翻译效果、从源语言音频输入到翻译文本输出/合成音频输出间的翻译实时性、翻译文本的平均擦除率表征的可读性、语音合成效果等，在同声传译过程中对各影响因素提出了具体要求，使得机器同声传译系统最终展现的整体质量更加均衡、全面。本申请的机器同声传译系统的测试方法能够完成对同声传译系统的各技术指标的全面测试，保证同声传译系统的质量。
机器同声传译系统方法测试装置相关设备

[发明专利]一种翻译模型训练方法、语音翻译方法及相关设备-CN202310166346.8在审
发明人： 张为泰;叶忠义 -专利权人：科大讯飞（上海）科技有限公司
申请日： 2023-02-24 - 公布日： 2023-06-23 - 主分类号： G06N3/096 文献下载
摘要：本发明提供了一种翻译模型训练方法、语音翻译方法及相关设备，翻译模型训练方法包括：获取训练数据集，训练数据集中的每条训练数据至少包括第一文本和第二文本，第一文本为存在若干问题中的一种或多种问题的文本，第二文本为第一文本对应的正确文本，若干问题包括识别错误、标点错误、切分错误和口语化问题；利用训练数据集中的训练数据，辅以教师模型，以使学生模型对训练数据中的第一文本进行翻译得到的翻译结果趋近于教师模型对同一训练数据中的第二文本进行翻译得到的翻译结果为目标对学生模型进行训练，训练得到的学生模型作为语音翻译系统中的翻译模型。采用本发明的训练方法可训练得到的具有较好翻译效果且对错误具有鲁棒性的翻译模型。
一种翻译模型训练方法语音相关设备

[发明专利]一种交互式文本翻译方法及装置-CN201811384437.4有效
发明人： 张为泰;刘俊华;魏思;王智国 -专利权人：科大讯飞股份有限公司
申请日： 2018-11-20 - 公布日： 2023-06-02 - 主分类号： G06F40/58 文献下载
摘要：本申请公开了一种交互式文本翻译方法及装置，该方法包括：先获取待修正的目标文本，该目标文本是对源文本进行翻译后的文本，然后检测用户是否对该目标文本进行了人工修正，若是，则在人工修正后的文本的基础上进行自动修正，得到修正后的翻译结果。可见，本申请在人工修正文本的基础上由机器进行自动修正，当将该修正结果作为源文本的翻译结果时，与目标文本相比，可以提升源文本的翻译结果的翻译质量，此外，在人工修正的提示下进行自动修正，可以有效提升修正效率。
一种交互式文本翻译方法装置

[发明专利]音频切分方法、装置、电子设备及存储介质-CN202211691057.1在审
发明人： 张为泰;叶忠义 -专利权人：科大讯飞（上海）科技有限公司
申请日： 2022-12-27 - 公布日： 2023-04-25 - 主分类号： G10L15/04 文献下载
摘要：本发明提供一种音频切分方法、装置、电子设备及存储介质，其中方法包括：获取待切分音频；提取所述待切分音频中各帧的声学特征，并基于所述各帧的声学特征，对所述待切分音频进行语义边界序列标注，得到所述各帧的语义边界标注结果；基于所述各帧的语义边界标注结果，对所述待切分音频进行切分。本发明提供的方法、装置、电子设备及存储介质，可以基于各帧的声学特征中的语气、停顿信息来辅助语义分句，保留了音频的完整的语义信息，且不会存在标点识别错误的情况，提高了音频切分的准确性和可靠性，并且该方法可以应用到级联方式和端到端方式的语音翻译系统中，扩大了音频切分的应用范围。
音频切分方法装置电子设备存储介质

[发明专利]语音翻译方法、装置、设备及可读存储介质-CN202211682639.3在审
发明人：周心远;邓攀;张为泰 -专利权人：科大讯飞（上海）科技有限公司
申请日： 2022-12-27 - 公布日： 2023-04-18 - 主分类号： G06F40/126 文献下载
摘要：本申请公开了一种语音翻译方法、装置、设备及可读存储介质。本方案中，在获取待翻译的源语言语音之后，对源语言语音进行处理，得到源语言类文本表征，并对源语言类文本表征进行解码得到目标语言文本，该方案中，生成的源语言类文本特征与真实的源语言文本的序列长度一致，基于源语言类文本表征得到的目标语言文本相对于基于源语言语音的声学特征得到的目标语言文本准确度更高，因此，本方案能够有效提高语音翻译的效果。
语音翻译方法装置设备可读存储介质

[发明专利]多语种机器翻译质量评估方法、模型、设备及存储介质-CN202211640692.7在审
发明人： 张为泰;叶忠义;刘俊华;杜俊 -专利权人：中国科学技术大学
申请日： 2022-12-20 - 公布日： 2023-04-11 - 主分类号： G06F40/51 文献下载
摘要：本发明公开一种多语种机器翻译质量评估方法、模型、设备及存储介质，方法包括：步骤1，利用预训练好的多语言语义编码器对给定平行句对的源语言和目标语言进行同一语义编码；步骤2，利用预先经层次化半监督质量评估训练及质量评估正反一致性联合训练好的多语种机器翻译质量评估模型对同一语义编码通过交叉注意力层来进行源与目标语言交互；步骤3，对交叉注意力层的输出通过全连接层进行信息交互和非线性化激活在CLS标签位置经sigmoid函数处理，以处理结果作为质量评估结果。通过用多语言语义编码统一建模，同时建模质量评估与多语言语种间相似性；用训练好的质量评估模型，解决了资源稀缺场景下模型可用性问题，也提高了评估效果一致性。
语种机器翻译质量评估方法模型设备存储介质

[发明专利]语音处理方法、装置、电子设备及存储介质-CN202211435210.4在审
发明人：黄爽;潘青华;张为泰;黄明登 -专利权人：科大讯飞股份有限公司
申请日： 2022-11-16 - 公布日： 2023-04-07 - 主分类号： G10L13/033 文献下载
摘要：本公开提供了一种语音处理方法、装置、电子设备及存储介质，涉及语音合成技术领域。该方法包括获取第一语音的声音特征；根据第一语音的声音特征，将第一语音的转写文本转换为第二语音，第二语音的声音特征与第一语音的声音特征相同，且第二语音的语种与第一语音的语种不同。本公开实施例能够使不同语种的语音在转换过程中，保留原始说话人的声音特征，以便听众能够根据不同的声音特征区分不同的说话人。
语音处理方法装置电子设备存储介质

[发明专利]数据增强方法、装置、设备及可读存储介质-CN202211632990.1在审
发明人： 张为泰;叶忠义;刘俊华;王士进 -专利权人：科大讯飞（上海）科技有限公司
申请日： 2022-12-19 - 公布日： 2023-04-07 - 主分类号： G06F40/58 文献下载
摘要：本申请公开了一种数据增强方法、装置、设备及可读存储介质。该方案中，先基于训练数据集、初始化的多语言神经机器翻译模型以及预设语言集合，得到训练用伪平行句对；再对训练数据集中的平行句对，和/或，训练用伪平行句对进行跨语言词替换处理，得到跨语言词替换处理后的平行句对；最后，将训练数据集、训练用伪平行句对以及跨语言词替换处理后的平行句对的组合作为初始化的多语言神经机器翻译模型的最新训练数据。本方案中，最新训练数据相对于训练数据集，数量更多，且不仅生成了训练用伪平行句对，还生成了跨语言词替换处理后的平行句对，使得平行句对更为丰富，因此能够更好地解决一些语言的双语平行句对稀缺的问题。
数据增强方法装置设备可读存储介质

[发明专利]一种翻译模型训练方法、文本翻译方法及相关装置-CN201910595220.6有效
发明人：章杰;宋锐;张为泰;刘俊华;王智国 -专利权人：科大讯飞股份有限公司
申请日： 2019-07-03 - 公布日： 2023-04-07 - 主分类号： G06F40/47 文献下载
摘要：本申请公开了一种翻译模型训练方法、文本翻译方法及相关装置，在该方法中，将至少一个样本文本中输入双向翻译模型，以便根据双向翻译模型的输出结果对双向翻译模型进行参数更新，其中，双向翻译模型的输出结果包括每一样本文本的预测翻译文本以及每一样本文本对应的预测词袋，且该预测词袋是朝着对应样本文本的实际词袋的方向预测得到的，该实际词袋包括对应样本文本的实际翻译文本中的各个不同词，因此，在对模型进行参数更新时，需要基于每一样本文本的预测词袋与其实际词袋之间的差异进行参数更新，使得该实际词袋可以用于指导翻译方向，故而，训练完成的双向翻译模型能够朝着输入样本文本的实际词袋的方向进行准确翻译。
一种翻译模型训练方法文本相关装置

[发明专利]多语种翻译数据质量评估系统、方法、设备及存储介质-CN202211648697.4在审
发明人： 张为泰;林超;杜俊 -专利权人：中国科学技术大学
申请日： 2022-12-21 - 公布日： 2023-03-10 - 主分类号： G06F30/27 文献下载
摘要：本发明公开了一种多语种翻译数据质量评估系统、方法、设备及存储介质，系统包括：基于约束解码的数据增强模块，能从多语种高质量文本句对库中获取多语种句对数据，进行局部约束翻译得出伪造句对数据；基于翻译词表的不确定性特征构建模块，能从多语种高质量文本句对库中获取句对数据，用蒙特卡洛采样进行多次前向传播，求出翻译过程中的置信度；质量评估置信度的数据挑选模块，能从多语种质量评估的语料库中获取句对数据，用蒙特卡洛采样进行多次前向传播计算出综合置信度，根据综合置信度从最新多语种质量评估模型预测评分数据中筛选出人工复检数据。能提升评估质量和质检人员的效率和效果。
语种翻译数据质量评估系统方法设备存储介质

[发明专利]一种翻译数据标注辅助系统、方法、设备及存储介质-CN202211653454.X在审
发明人： 张为泰;叶忠义;刘俊华;杜俊 -专利权人：中国科学技术大学
申请日： 2022-12-21 - 公布日： 2023-03-10 - 主分类号： G06F40/47 文献下载
摘要：本发明公开了一种翻译数据标注辅助系统、方法、设备及存储介质，系统包括：机器翻译候选结果挑选模块，能对待翻译句对多机器翻译出多个候选翻译结果，经近似检索得出最接近的标注结果，经自对比得出最佳候选译文；译员翻译能力自适应任务分配模块，能将最佳候选译文分配给翻译能力值匹配的译员进行修改；译员水平动态质检模块，能接收各人工修改结果数据，并基于各译员的翻译能力值动态抽选不同量级的最终人工翻译数据来进行质检；多策略主动学习迭代更新模块，将质检完的翻译结果数据依次回流到机器翻译模型和质量评估模型中进行主动学习。能高效、高质量的辅助翻译数据标注。
一种翻译数据标注辅助系统方法设备存储介质

[发明专利]一种口语翻译方法、系统及电子设备-CN202211226252.7在审
发明人： 张为泰;刘微微;宋彦 -专利权人：中国科学技术大学
申请日： 2022-10-09 - 公布日： 2023-01-10 - 主分类号： G06F40/58 文献下载
摘要：本申请公开了一种口语翻译方法、系统及电子设备，本方案在获得口语化语言数据后，将规整后的口语化语言数据输入至融入掩码信息及流畅度信息的机器翻译模型中，以得到翻译后的译文，通过机器翻译模型中的掩码信息，能够使得在对机器翻译模型进行训练时加入掩码信息，以增强对输入至机器翻译模型的单语数据中缺失词语的预测能力，从而提高容错性；同时，在机器翻译模型中加入流畅度信息，能够优化机器翻译模型的输出，以提高模型输出的译文的流畅性，从而改善错译、直译、漏译等现象。
一种口语翻译方法系统电子设备

[发明专利]一种视频字幕翻译方法、装置以及设备-CN202211027303.3在审
发明人：许瑞阳;叶忠义;张为泰;刘聪 -专利权人：科大讯飞股份有限公司
申请日： 2022-08-25 - 公布日： 2022-11-25 - 主分类号： G06V20/40 文献下载
摘要：本发明公开了一种视频字幕翻译方法、装置以及设备，视频字幕翻译方法包括：提取视频中的至少一个第一视频帧和/或第一视频帧序列；依据至少一个第一视频帧和/或第一视频帧序列确定视频所属的场景类型下的领域类型；依据场景类型下的领域类型对视频进行转写和翻译。本发明从视频本身的信息出发，对视频进行语义分析，从而确定视频所属的场景类型和细分领域，有助于在转写和翻译中明确确定转写和翻译结果。
一种视频字幕翻译方法装置以及设备

[发明专利]平行句对构建方法、装置、电子设备和存储介质-CN202210688236.3在审
发明人： 张为泰;叶忠义;刘俊华;胡郁 -专利权人：科大讯飞股份有限公司
申请日： 2022-06-16 - 公布日： 2022-09-16 - 主分类号： G06F40/58 文献下载
摘要：本发明提供一种平行句对构建方法、装置、电子设备和存储介质，其中方法包括：获取第一语句和第二语句，第一语句和第二语句对应不同语种；基于跨语种语言模型，确定第一语句的第一语义特征和第二语句的第二语义特征，跨语种语言模型是基于第一样本语句中各分词与第二样本语句中各分词之间的词义关系训练得到的，第一样本语句和第二样本语句对应不同语种；基于第一语义特征和第二语义特征之间的相似度，构建平行句对，本发明实施例中，应用不同语种的样本语句各自包含的分词之间的词义关系，进行模型训练，能够使训练所得的模型性能更优，在面向稀缺资源语言时，提升了句子嵌入的准确度，精进了平行句对的构建过程，实现了平行句对构建质量的提升。
平行构建方法装置电子设备存储介质

[发明专利]一种基于整字和偏旁部首的层次化建模方法及系统-CN202110523430.1有效
发明人：杨争艳;吴嘉嘉;张为泰;宋彦 -专利权人：中国科学技术大学
申请日： 2021-05-13 - 公布日： 2022-09-06 - 主分类号： G06V20/62 文献下载
摘要：本发明涉及一种基于整字和偏旁部首的层次化建模方法及系统，其方法包括：S1：将文本行图像经过卷积神经网络和循环神经网络，得到文本行图像的序列特征；S2：将文本行图像的序列特征，输入有注意力机制的整字解码模块，得到整字的上下文特征向量以及整字的解码结果；S3：将整字的上下文特征向量输入偏旁部首解码模块，得到整字层级下的各个偏旁部首的解码结果；S4：利用置信度得分融合策略，将整字和各偏旁部首的解码置信度进行融合，得到整字的识别结果。本发明提供的方法，不仅能实现整字的识别，同时实现该时刻偏旁部首的识别，通过整字和偏旁部首解码置信度融合的策略，不仅能够提升低频字的识别效果，同时最大化地保证了非低频字识别的效果。
一种基于偏旁部首层次建模方法系统

1
2
3
下一页»
尾页
共 33 条