[发明专利]一种基于音标的语音编码方法在审
申请号: | 201410386135.6 | 申请日: | 2014-08-06 |
公开(公告)号: | CN104575506A | 公开(公告)日: | 2015-04-29 |
发明(设计)人: | 闻冰;白青山 | 申请(专利权)人: | 闻冰;白青山 |
主分类号: | G10L19/02 | 分类号: | G10L19/02 |
代理公司: | 无 | 代理人: | 无 |
地址: | 518057 广东省深圳市南山区科技园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 音标 语音 编码 方法 | ||
技术领域
本发明涉及语音编码技术,特别是涉及在语音编码过程中以音标作为语音波形分类标准的应用。
背景技术
编码、传输、存储和译码是语音数字传输和数字存储的必要过程。语音编码的目的就是要使表达语音信号的比特数目最小。
语音编码就是对模拟的语音信号进行编码,将模拟信号转化成数字信号,从而降低传输码率并进行数字传输。
语音编码的基本方法可分为波形编码、参量编码(音源编码)和混合编码。
波形编码是将时域的模拟话音的波形信号经过取样、量化、编码而形成的数字话音信号;参量编码是基于人类语言的发音机理,找出表征语音的特征参量,对特征参量进行编码;混合编译码是结合波形编译码和参量编译码之间的优点。
发明内容
本发明是一种基于音标的语音编码方法,其特征在于,包括:
通过对源语音按照语言学的音标体系进行分类,进而对源语音频谱进行波形分析,从而得到与音标对应的单音素波形片段与有限个音素组合的多音素波形片段,并以音标记录音频波形片段(可以多个近似波形片段映射一个音标);再把这些音标的文本信息转换为二进制代码;通过逆向的解码过程,由上述音标的文本信息转换而成的二进制代码也可以被还原成音标的文本信息,进一步地,音标的文本信息被还原成为拟制语音,从而实现语音承载信息的传递。
源语音经过编码处理后,以音标——即一种语音代码——的文本替代语音音频本身,使得该段语音信息的存储、传输占用资源大大降低。
源语音经过编码处理后,再解码还原的语音,是拟制语音,是对源语音中声音本身的部分信息有选择地舍弃,突出了对语音承载的信息中语言信息的保留。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于闻冰;白青山;,未经闻冰;白青山;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410386135.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:降噪方法、降噪装置和终端
- 下一篇:一种收音机语音操控指令解析方法及系统