[发明专利]一种语音即时通讯方法及装置在审
申请号: | 201310719376.3 | 申请日: | 2013-12-20 |
公开(公告)号: | CN104732975A | 公开(公告)日: | 2015-06-24 |
发明(设计)人: | 薛松 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;H04L12/58 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 即时通讯 方法 装置 | ||
技术领域
本发明涉及即时通讯技术领域,尤其涉及一种语音即时通讯方法及装置。
背景技术
目前即时通讯工具的应用越来越广泛,用户可以通过即时通讯工具和其他用户进行即时通信,发送/接收文字、语音等信息。
目前的即时通讯工具在采用语音形式进行即时通讯时,通常采用的方式是直接发送和接收音频,如图1所示,例如用户采用语音形式即时通讯时,点击即时通信应用界面上的按钮开始录制声音,录制过程中长按按钮,录制完后释放按钮并发送到接收方。录制完成并发送音频信息后,即时通信应用界面上显示一个按钮,按钮的长度和音频长度成正比,并在按钮旁边显示音频的时长、录制时刻等信息。接收方接收到音频信息后获取该音频信息的音频长度及接收时刻等信息,在即时通信应用界面上显示按钮,同样按钮的长度和音频长度成正比,并在按钮旁边显示音频的时长、录制时刻等信息,确定用户点击该按钮时通过播放器开始播放该段音频信息,因此用户就能收听这段音频信息。
对于以直接发送和接收音频信息的方式进行语音通讯时,接收方接收到音频信息后,要想获取音频信息,仅可以通过选择音频播放的形式获取,该方式具有以下技术缺陷:
1)在环境嘈杂的情况下播放音频信息时,所播放的音频信息受环境影响,导致用户难以听清楚,从而用户无法正确获取到音频信息,如果想获取正确的音频信息,需要在私密的场合下播放音频信息;
2)在需要回溯信息的时候,用户需要重新点击按钮重新播放音频信息,听的速度本身就比较慢,而且在有大量对话的情况下,通过重新播放音频信息的方式查找需要的信息就很麻烦。
发明内容
本发明实施例提供一种语音即时通讯方法及装置,以克服现有语音即时通讯方法仅通过听的方式获取音频信息所存在的音频信息受环境影响、回溯信息较麻烦的问题。
第一方面,提供一种语音即时通讯方法,包括:
收到音频信息时,在即时通信应用的界面上显示与所述音频信息对应的语音播放图标;
利用语音识别模块对所述音频信息进行语音识别,得到所述音频信息对应的文字信息,并在所述即时通信应用的界面上显示所述音频信息对应的文字信息。
结合第一方面,第一种可能的实现方式,该方法还包括:
在显示在所述即时通信应用的界面上的所述音频信息对应的文字信息被修改时,在所述即时通信应用的界面上显示修改后的所述音频信息对应的文字信息。
结合第一方面,第一方面第一种可能的实现方式中,该方法还包括:
将所述音频信息以及修改后的所述音频信息对应的文字信息反馈给所述语音识别模块,以使得所述音频信息以及修改后的所述音频信息对应的文字信息作为所述语音识别模块的语音识别训练样本使用。
结合第一方面,第二种可能的实现方式,在利用语音识别模块对所述音频信息进行语音识别之前,所述方法还包括:
通过所述即时通信应用界面提示用户是否需要语音识别,在确定需要语音识别时,执行利用语音识别模块对所述音频信息进行语音识别的步骤。
结合第一方面,第三种可能的实现方式,所述语音播放图标为与音频信息的时长成正比的播放按钮,所述音频信息对应的文字信息以气泡文本框的形式与所述播放按钮衔接显示,或者所述音频信息对应的文字信息在所述语音播放图标上面显示。
第二方面,本发明实施例还提供一种语音即时通讯方法,包括:
通过语音采集模块获取用户录入的音频信息;
利用语音识别模块对获取的音频信息进行语音识别,得到所述音频信息对应的文字信息;
将获取的音频信息及对应的文字信息发送到即时通信的对端,并在即时通信应用的界面上显示与所述音频信息对应的语音播放图标及文字信息。
结合第二方面,第一种可能的实施方式,该方法还包括:
在显示在所述即时通信应用的界面上的所述音频信息对应的文字信息被修改时,在所述即时通信应用的界面上显示修改后的所述音频信息对应的文字信息。
结合第二方面,第二方面第一种可能的实施方式中,该方法还包括:
将所述音频信息以及修改后的所述音频信息对应的文字信息反馈给所述语音识别模块,以使得所述音频信息以及修改后的所述音频信息对应的文字信息作为所述语音识别模块的语音识别训练样本使用。
第三方面,本发明实施例提供一种语音即时通讯装置,包括:
播放显示单元,用于收到音频信息时,在即时通信应用的界面上显示与所述音频信息对应的语音播放图标;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;,未经华为技术有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310719376.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种在线口语发音质量评价方法和系统
- 下一篇:一种可穿戴式音乐演奏系统