[发明专利]基于同声传译的数据处理方法、装置和存储介质有效
申请号: | 201810443090.X | 申请日: | 2018-05-10 |
公开(公告)号: | CN108615527B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 白晶亮;欧阳才晟;刘海康;陈联武;陈祺;张宇露;罗敏;苏丹 | 申请(专利权)人: | 腾讯科技(北京)有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/26;G10L21/0208;G10L25/78;G06F40/58 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 李文渊;何平 |
地址: | 100080 北京市海淀区海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 同声 传译 数据处理 方法 装置 存储 介质 | ||
本申请涉及一种基于同声传译的数据处理方法、装置和存储介质,所述方法包括:获取音频;通过同声传译模型处理所述音频得到相应的文本;将所述文本发送至用户终端;接收所述用户终端所反馈的、对所述文本修改后所得到的修改文本;根据所述文本和所述修改文本更新所述同声传译模型。本申请提供的方案可以提高由处理音频所得到的文本的准确性。
技术领域
本申请涉及同声传译技术领域,特别是涉及一种基于同声传译的数据处理方法、装置和存储介质。
背景技术
同声传译(Simultaneous Interpretation),简称“同传”,是指在不打断演讲者演讲的情况下,不间断地将演讲内容翻译给观众的翻译方式。目前,世界上95%的国际会议都采用同声传译的方式。
传统的同声传译技术方案中,常用的同声传译方法为:同声传译客户端采集演讲者发出的音频,并对该音频进行降噪处理,将处理后的音频上传到服务器。服务器对接收的音频进行语音识别,并将语音识别的文本翻译为目标语种的文本,然后将语音识别的文本和翻译后的文本展示于同声传译系统的显示屏。
然而,在传统的同声传译技术方案中,当服务器处理语音所得的文本出错时,用户终端无法对出错的文本进行处理和反馈,服务器也无法对出错的文本进行矫正,从而影响了同声传译中文本内容的准确性。
发明内容
基于此,有必要针对同声传译中文本内容的准确性偏低的技术问题,提供一种基于同声传译的数据处理方法、装置和存储介质。
一种基于同声传译的数据处理方法,包括:
获取音频;
通过同声传译模型处理所述音频得到相应的文本;
将所述文本发送至用户终端;
接收所述用户终端所反馈的、对所述文本修改后所得到的修改文本;
按照与所述用户终端的标识对应的权重,确定所述修改文本的加权累积值;
当所述加权累积值达到阈值时,根据所述文本和所述修改文本更新所述同声传译模型。
一种基于同声传译的数据处理装置,包括:
获取模块,用于获取音频;
处理模块,用于通过同声传译模型处理所述音频得到相应的文本;
发送模块,用于将所述文本发送至用户终端;
接收模块,用于接收所述用户终端所反馈的、对所述文本修改后所得到的修改文本;
更新模块,根据所述文本和所述修改文本更新所述同声传译模型。
一种存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述基于同声传译的数据处理方法的步骤。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上述基于同声传译的数据处理方法的步骤。
上述基于同声传译的数据处理方法、装置和存储介质,通过接收终端反馈的对文本修改后所得到的修改文本,实现了当处理音频所得到的文本发生修改时,能及时地获得相应的反馈。根据文本和修改文本更新同声传译模型,通过更新后的同声传译模型对音频进行处理,从而提高了由处理音频所得到的文本的准确性。
一种基于同声传译的数据处理方法,包括:
展示同声传译辅助页面;
接收服务器发送的文本;所述文本是通过同声传译模型处理音频得到;
在所述同声传译辅助页面中展示所述文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(北京)有限公司,未经腾讯科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810443090.X/2.html,转载请声明来源钻瓜专利网。