[发明专利]基于同声传译的数据处理方法、装置和存储介质有效

申请号：	201810443090.X	申请日：	2018-05-10
公开（公告）号：	CN108615527B	公开（公告）日：	2021-10-15
发明（设计）人：	白晶亮;欧阳才晟;刘海康;陈联武;陈祺;张宇露;罗敏;苏丹	申请（专利权）人：	腾讯科技（北京）有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/26;G10L21/0208;G10L25/78;G06F40/58
代理公司：	广州华进联合专利商标代理有限公司 44224	代理人：	李文渊;何平
地址：	100080 北京市海淀区海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于同声传译数据处理方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于同声传译的数据处理方法，包括：

获取音频；

通过同声传译模型处理所述音频得到相应的文本；所述同声传译模型包括语音模型和翻译模型，所述文本包括由所述语音模型识别所述音频所得的识别文本和由所述翻译模型翻译所述识别文本所得的翻译文本；

将所述文本发送至用户终端，以在所述用户终端的同声传译辅助页面显示所述文本；

接收所述用户终端所反馈的、对所述文本修改后所得到的修改文本；所述修改文本包括基于检测到的修改指令对所述识别文本修改所得的修改识别文本，和/或对所述翻译文本修改所得的修改翻译文本；

当所述修改文本的加权累积值达到阈值时，根据所述文本和所述修改文本更新所述同声传译模型；所述修改文本的加权累积值是通过不同用户终端标识对应的权重所确定的。

2.根据权利要求1所述的方法，其特征在于，所述通过同声传译模型处理所述音频得到相应的文本，包括：

将所述音频进行降噪处理；

获取降噪处理后的音频中的语音部分；

从所述语音部分中获取能量值大于或等于能量阈值的音频部分；

通过同声传译模型处理所述音频部分获得相应的识别文本和翻译文本。

3.根据权利要求1所述的方法，其特征在于，所述同声传译模型包括通用语音模型和辅助语音模型；

所述文本还包括识别更新文本；

所述识别文本是通过所述通用语音模型对所述音频进行语音识别得到；

所述识别更新文本是通过所述辅助语音模型更新所述识别文本得到；

所述根据所述文本和所述修改文本更新所述同声传译模型，包括：

根据所述翻译文本、所述识别更新文本和所述修改文本更新所述辅助语音模型。

4.根据权利要求1所述的方法，其特征在于，当所述修改文本为所述基于所述翻译文本修改所得的修改翻译文本时，所述根据所述文本和所述修改文本更新所述同声传译模型，包括：

根据所述翻译文本和所述修改翻译文本更新所述翻译模型。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

接收与所述音频匹配的视频；

将所述识别文本和所述翻译文本嵌入所述视频；

所述将所述文本发送至用户终端，包括：

将已嵌入所述识别文本和所述翻译文本的视频发送至用户终端。

6.根据权利要求1所述的方法，其特征在于，所述音频与会议号对应；所述将所述文本发送至用户终端，包括：

将所述识别文本和所述翻译文本发送至通过所述会议号接入的用户终端；

所述方法还包括：

接收所述用户终端所反馈的评论信息；

在通过所述会议号接入的用户终端间同步所述评论信息。

7.根据权利要求1所述的方法，其特征在于，所述音频与会议号对应；所述将所述文本发送至用户终端，包括：

将所述识别文本和所述翻译文本发送至通过所述会议号接入的用户终端；

所述方法还包括：

将所述识别文本和所述翻译文本与所述会议号对应存储；

当所述加权累积值达到阈值时，将与所述会议号对应存储的识别文本和翻译文本更新为所述修改文本；

当接收到通过所述会议号接入的用户终端所发送的同步请求时，向发起所述同步请求的终端反馈与所述会议号对应存储的更新后的所述修改文本。

8.根据权利要求1至7中任一项所述的方法，其特征在于，所述方法还包括：

统计与所述用户终端的标识对应的文本修改次数；

检测所述用户终端的标识对应的文本修改正确率；

当所述文本修改次数达到修改次数阈值、且所述文本修改正确率达到文本修改正确率阈值时，调高与所述用户终端的标识对应的权重。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯科技（北京）有限公司，未经腾讯科技（北京）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810443090.X/1.html，转载请声明来源钻瓜专利网。

上一篇：语音信号中关键词的检测方法、装置、终端及存储介质
下一篇：一种信息处理方法及电子设备

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于同声传译的数据处理方法、装置和存储介质有效

专利文献下载