[发明专利]语音输入方法及系统有效

申请号：	201210101302.9	申请日：	2012-03-31
公开（公告）号：	CN103366742B	公开（公告）日：	2018-07-31
发明（设计）人：	李曜;许东星	申请（专利权）人：	上海果壳电子有限公司
主分类号：	G10L15/26	分类号：	G10L15/26;G06F3/16
代理公司：	上海百一领御专利代理事务所(普通合伙) 31243	代理人：	马育麟
地址：	201203 上海市***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音输入方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种语音输入方法及系统，所述方法包括：在录音的同时不断将输入的语音切分语音片段并生成每个语音片段的文本；以及依次显示每个语音片段的文本，根据用户的选择依次对每个语音片段的文本进行修正。本发明可以自动切分语音识别结果并进行分段返回供用户二次确认，用户可以一边录音一边对返回文本进行修改和确认。

技术领域

本发明属于语音识别领域，特别涉及一种语音输入方法及系统。

背景技术

随着语音识别技术的进步以及云计算的兴起，在移动终端上采用语音输入并通过云端服务器进行语音到文本的转写并将文本返回到移动终端的方案已成为一种趋势。由于移动终端的尺寸限制，直接通过物理或虚拟键盘进行文本输入的便捷性总是不尽如人意，可以预见语音输入将在越来越多的地方替代按键输入。

但是，语音识别准确率难以达到100％的现状阻碍了语音输入彻底替代按键输入的进程。事实上，由于生活中各种条件下真实发音的复杂性，语音识别的准确率永远不可能达到100％，尤其是在噪音环境下，识别结果中必然可能存在各种错误，也就是说，对于语音识别的结果必然存在一个二次确认的过程。现有的语音输入方案是如下：当按下录音键之后，移动终端上会弹出如图1所示的表示正在录音的界面，然后用户开始说话，说完之后，会在如图2所示的界面上将识别到的文本展示在一文本输入框21内，若该文本输入框21内的文本存在识别错误，再由用户调出键盘22进行修改并确认保存。然而这种语音输入方案中，在录音过程中用户不能对识别结果作任何编辑，必须在一次性将要输入的语音全部说完后，用户才能对返回文本中的错误进行一一修改并确认保存，然后再将确认过的文本用于后续诸如发短信，发邮件，记事之类的应用。所以，这种确认过程通常对于用户来说比较繁琐、不够友好。

发明内容

本发明的目的在于提供一种语音输入方法及系统，能够对输入语音自动进行分段识别，用户可边录音边对分段识别到的文本进行修正。

为解决上述问题，本发明提供一种语音输入方法，包括：

在录音的同时不断将输入的语音切分语音片段并生成每个语音片段的文本；以及

依次显示每个语音片段的文本，根据用户的选择依次对每个语音片段的文本进行修正。

进一步的，在上述方法中，由云端服务器不断将输入的语音切分语音片段并生成每个语音片段的文本。

进一步的，在上述方法中，通过语音端点检测算法不断将输入的语音切分语音片段。

进一步的，在上述方法中，所述根据用户的选择依次对每个语音片段的文本进行修正的步骤包括：

用户选择每个语音片段的文本中需要修正的内容；

生成对应于所述内容中每个字的候选字、所述内容中每个字的音节和对应于所述内容中每个字的候选音节；

根据用户选择的所述候选字、所述音节和所述候选音节对读音片段中的文本进行修正。

进一步的，在上述方法中，所述根据用户选择的所述候选字、所述音节和所述候选音节对读音片段中的文本进行修正的步骤包括：