[发明专利]处理方法和装置、用于处理的装置有效
申请号: | 201710382043.4 | 申请日: | 2017-05-26 |
公开(公告)号: | CN107291704B | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 姜里羊;王宇光;陈伟;刘晓博 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/30;G06F40/279;G10L15/26 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理 方法 装置 用于 | ||
本发明实施例提供了一种处理方法和装置、用于处理的装置,其中的方法具体包括:获取经过标点添加处理的语音识别结果对应的文本;获取当前时刻的有效文本所包含的目标标点;若所述目标标点符合预置的识别结果稳定条件时,输出目标文本;所述目标文本为所述当前时刻的有效文本中所述目标标点及所述目标标点之前的字符组成的文本。本发明实施例可以有效减少翻译结果滞相对于语音信号的滞后性,且可以提高翻译结果的实时性,有效提升用户体验。
技术领域
本发明涉及语音翻译技术领域,特别是涉及一种处理方法和装置、以及一种用于处理的装置。
背景技术
随着国际性交流的增加,使用不同语种的语言沟通越来越频繁。为克服语言障碍,基于客户端进行在线语音翻译得到广泛的应用。
在线语音翻译一般涉及两个环节,第一是进行语音识别,即将用户输入的第一语种的语音信号转换为文本信息;第二是通过机器翻译装置对文本信息进行在线翻译,以得到作为翻译结果的第二语种的文本信息,最后向用户提供第二语种的文本信息或者语音信息。
现有方案通常依据第一语种的语音信号的停顿来判断文本信息对应句子的结束,并在判断文本信息对应句子结束后,向机器翻译装置发送文本信息对应句子,以使机器翻译装置对文本信息对应句子进行在线翻译,由此可以提高机器翻译装置的翻译质量。
然而,在实际应用中,现有方案在语音信号出现停顿的情况下、对文本信息对应句子进行在线翻译,容易导致翻译结果滞后于第一语种的语音信号。尤其地,对于语速过快、一直没有停顿的语音信号而言,这种滞后将更加明显。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的处理方法、处理装置、用于处理的装置,本发明实施例可以有效减少翻译结果滞相对于语音信号的滞后性,且可以提高翻译结果的实时性,有效提升用户体验。
为了解决上述问题,本发明公开了一种处理方法,包括:
获取经过标点添加处理的语音识别结果对应的文本;
获取当前时刻的有效文本所包含的目标标点;
若所述目标标点符合预置的识别结果稳定条件时,输出目标文本;所述目标文本为所述当前时刻的有效文本中所述目标标点及所述目标标点之前的字符组成的文本。
可选地,所述判断所述目标标点是否符合预置的识别结果稳定条件,包括:
依据所述目标标点对当前时刻Tk的有效文本、以及Tk之前的时刻的有效文本进行截断处理;
若当前时刻的有效文本对应的在先截断处理结果与Tk之前的时刻的有效文本对应的在先截断处理结果一致,则判定所述目标标点符合预置的识别结果稳定条件。
可选地,所述当前时刻的有效文本符合预置的标点稳定条件。
可选地,所述有效文本符合预置的标点稳定条件,包括:
所述有效文本为当前时刻的文本中除了位于后部的M-1个字符单元之外的文本;所述字符单元包括:词和/或标点符号;M为一次标点添加处理涉及的字符单元的数量。
可选地,所述获取当前时刻的有效文本所包含的目标标点,包括:
从当前时刻的有效文本包含的倒数第M个字符单元开始,按照从后到前的顺序查找当前时刻的有效文本包含的标点,作为当前时刻的有效文本所包含的目标标点。
可选地,所述当前时刻的有效文本不包括:已输出的目标文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710382043.4/2.html,转载请声明来源钻瓜专利网。