[发明专利]一种文字音频推送方法有效
申请号: | 201910188890.6 | 申请日: | 2019-03-13 |
公开(公告)号: | CN109887493B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 虞焰兴 | 申请(专利权)人: | 安徽声讯信息技术有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/07;G10L15/26;G10L15/30;G10L19/00 |
代理公司: | 合肥律众知识产权代理有限公司 34147 | 代理人: | 冯慧云 |
地址: | 230000 安徽省合肥市高新区习友路33*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文字音频推送方法,属于音频处理技术领域,包括S1.声音处理;S2.分段识别;S3.音频记忆;S4.根据概率识别音频;S5.音频文字推送。通过音频识别设备先将采集到的音频处理成声音波,再根据设备设置的前端点和后端点作为音频识别区间,采集到的音频被分段识别,每识别一段就推送给用户,这样用户在说话时每说完一句在停顿的间隙中,该段音频被识别成文字后推送出去,因此用户接收到的音频文字被分为一段段,每段发送的音频文字占用容量较小,即使网速较慢也可以快速的推送给用户,而且分段的文字便于用户观看。 | ||
搜索关键词: | 一种 文字 音频 推送 方法 | ||
【主权项】:
1.一种文字音频推送用心跳技术,其特征在于,包括以下步骤:S1.声音处理:由音频识别设备采集声音,将采集到的声音音频数据通过语音编码技术进行处理,生成声音波形,该波形的X轴为时间轴,单位为毫秒,Y轴为音量轴,单位为分贝;S2.分段识别:设置音频识别设备在前端点到后端点这一区间内识别文字,前端点和后端点均为声音产生到结束的时间间隔,前端点设定为100毫秒,后端点设定为500毫秒,当声音从产生到有效这段时间在100毫秒内时,音频设备开始识别声音,当声音从有效到结束的时间间隔到达500毫秒时,音频设备停止识别声音;S3.音频记忆:音频识别设备识别一次声音后记录声音从开始到结束的频率,通过分布函数计算出音频的平衡值,多次识别声音后将平衡值出现的不同概率以高到低的顺序依次保存到内部处理器中;S4.根据概率识别音频:由于每个人说话的音色不同,每个音频段采用的前端点和后端点不同,音频识别设备识别一段新的音频时,先以出现概率最高的平衡值的音频段作为识别依据,如果该音频为新的音频段时,重复上述S3将平衡值记忆,如果为S3记忆的音频段,直接选取该音频段的前端点和后端点;S5.音频文字推送:音频识别设备根据S1‑S4步骤识别的文字通过内部的推送模块推送给用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽声讯信息技术有限公司,未经安徽声讯信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910188890.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法、装置和电子设备
- 下一篇:重构语音信号的方法和装置