[发明专利]基于同声传译的数据处理方法、装置和存储介质有效
申请号: | 201810443090.X | 申请日: | 2018-05-10 |
公开(公告)号: | CN108615527B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 白晶亮;欧阳才晟;刘海康;陈联武;陈祺;张宇露;罗敏;苏丹 | 申请(专利权)人: | 腾讯科技(北京)有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/26;G10L21/0208;G10L25/78;G06F40/58 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 李文渊;何平 |
地址: | 100080 北京市海淀区海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 同声 传译 数据处理 方法 装置 存储 介质 | ||
1.一种基于同声传译的数据处理方法,包括:
获取音频;
通过同声传译模型处理所述音频得到相应的文本;所述同声传译模型包括语音模型和翻译模型,所述文本包括由所述语音模型识别所述音频所得的识别文本和由所述翻译模型翻译所述识别文本所得的翻译文本;
将所述文本发送至用户终端,以在所述用户终端的同声传译辅助页面显示所述文本;
接收所述用户终端所反馈的、对所述文本修改后所得到的修改文本;所述修改文本包括基于检测到的修改指令对所述识别文本修改所得的修改识别文本,和/或对所述翻译文本修改所得的修改翻译文本;
当所述修改文本的加权累积值达到阈值时,根据所述文本和所述修改文本更新所述同声传译模型;所述修改文本的加权累积值是通过不同用户终端标识对应的权重所确定的。
2.根据权利要求1所述的方法,其特征在于,所述通过同声传译模型处理所述音频得到相应的文本,包括:
将所述音频进行降噪处理;
获取降噪处理后的音频中的语音部分;
从所述语音部分中获取能量值大于或等于能量阈值的音频部分;
通过同声传译模型处理所述音频部分获得相应的识别文本和翻译文本。
3.根据权利要求1所述的方法,其特征在于,所述同声传译模型包括通用语音模型和辅助语音模型;
所述文本还包括识别更新文本;
所述识别文本是通过所述通用语音模型对所述音频进行语音识别得到;
所述识别更新文本是通过所述辅助语音模型更新所述识别文本得到;
所述根据所述文本和所述修改文本更新所述同声传译模型,包括:
根据所述翻译文本、所述识别更新文本和所述修改文本更新所述辅助语音模型。
4.根据权利要求1所述的方法,其特征在于,当所述修改文本为所述基于所述翻译文本修改所得的修改翻译文本时,所述根据所述文本和所述修改文本更新所述同声传译模型,包括:
根据所述翻译文本和所述修改翻译文本更新所述翻译模型。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收与所述音频匹配的视频;
将所述识别文本和所述翻译文本嵌入所述视频;
所述将所述文本发送至用户终端,包括:
将已嵌入所述识别文本和所述翻译文本的视频发送至用户终端。
6.根据权利要求1所述的方法,其特征在于,所述音频与会议号对应;所述将所述文本发送至用户终端,包括:
将所述识别文本和所述翻译文本发送至通过所述会议号接入的用户终端;
所述方法还包括:
接收所述用户终端所反馈的评论信息;
在通过所述会议号接入的用户终端间同步所述评论信息。
7.根据权利要求1所述的方法,其特征在于,所述音频与会议号对应;所述将所述文本发送至用户终端,包括:
将所述识别文本和所述翻译文本发送至通过所述会议号接入的用户终端;
所述方法还包括:
将所述识别文本和所述翻译文本与所述会议号对应存储;
当所述加权累积值达到阈值时,将与所述会议号对应存储的识别文本和翻译文本更新为所述修改文本;
当接收到通过所述会议号接入的用户终端所发送的同步请求时,向发起所述同步请求的终端反馈与所述会议号对应存储的更新后的所述修改文本。
8.根据权利要求1至7中任一项所述的方法,其特征在于,所述方法还包括:
统计与所述用户终端的标识对应的文本修改次数;
检测所述用户终端的标识对应的文本修改正确率;
当所述文本修改次数达到修改次数阈值、且所述文本修改正确率达到文本修改正确率阈值时,调高与所述用户终端的标识对应的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(北京)有限公司,未经腾讯科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810443090.X/1.html,转载请声明来源钻瓜专利网。