[发明专利]一种语音声学特征扩大系统在审
申请号: | 201811443497.9 | 申请日: | 2018-11-29 |
公开(公告)号: | CN109346058A | 公开(公告)日: | 2019-02-15 |
发明(设计)人: | 程冰 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G10L13/033 | 分类号: | G10L13/033;G10L13/027;G10L15/25;G10L21/007;G10L25/18;G10L25/57 |
代理公司: | 北京市诚辉律师事务所 11430 | 代理人: | 范盈 |
地址: | 710049 陕西省西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请属于声音处理技术领域,特别是涉及一种语音声学特征扩大系统。在语言学习过程中,需要对语音声学特征进行扩大后为学习者制作出适合大脑感知的语料来刺激大脑。本申请提供一种语音声学特征扩大系统,包括语音获取单元,所述语音获取单元与语音处理单元相连接,所述语音处理单元与视频编辑单元相连接;其中,所述语音获取单元,用于对自然语音进行获取;所述语音处理单元,用于对自然语音中的频谱特征进行不同程度的扩大,以制作语料;所述视频编辑单元,用于将语音视频与处理过的语音编辑后合成视频片段。该语音声学特征扩大系统可以制作出更适合大脑感知的语料,从而帮助学习者在在大脑中形成更为接近母语者的语音范畴。 | ||
搜索关键词: | 语音声学 扩大系统 语音处理单元 获取单元 大脑 语音 视频编辑单元 自然语音 语料 感知 声音处理技术 语言学习过程 合成视频 频谱特征 语音编辑 语音视频 母语 申请 制作 刺激 帮助 | ||
【主权项】:
1.一种语音声学特征扩大系统,其特征在于:包括语音获取单元,所述语音获取单元与语音处理单元相连接,所述语音处理单元与视频编辑单元相连接;所述语音获取单元,用于对自然语音进行获取;所述语音处理单元,用于对自然语音中的频谱特征进行不同程度的扩大,制作语料;所述视频编辑单元,用于将语音视频与处理过的语音编辑后合成不同视频片段。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811443497.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种智能儿童玩具的语音处理系统
- 下一篇:语音识别方法、装置、设备及存储介质
- 同类专利
- 声音合成装置、声音合成方法及程序-201780088311.X
- 森田真弘;森纮一郎;大谷大和 - 东芝数字解决方案株式会社
- 2017-09-26 - 2019-11-08 - G10L13/033
- 实施方式的声音合成装置具有声音合成部(10)、讲话者参数存储部(50)、可否利用判定部(60)和讲话者参数控制部(40)。声音合成部(10)能够根据与讲话者特性相关的参数的值即讲话者参数值控制合成声音的讲话者特性。讲话者参数存储部(50)存储已登记讲话者参数值。可否利用判定部(60)根据将所输入的讲话者参数值与已登记讲话者参数值分别比较的结果,判定所输入的讲话者参数值的可否利用。讲话者参数控制部(40)禁止或者限制通过所述可否利用判定部(60)被判定为不可以利用的讲话者参数值的利用。
- 声音合成装置及声音合成方法-201510968697.6
- 田中飞雄太 - 卡西欧计算机株式会社
- 2015-12-22 - 2019-11-05 - G10L13/033
- 声音合成装置及声音合成方法。从目标韵律中提取音高频率的时间变化作为音高序列。将提取出的音高序列的各频率值用适当的粗糙度进行量化。对于量化了的音高序列,通过运算时间方向的加权移动平均而进行时间方向的平滑化,计算出被平滑化了的音高序列。结果,能够对应于细微变动的音高序列而得到具有自然的音高变化的被平滑化了的音高序列。使通过波形合成方式而被波形连接的连接声音片段的各时间的音高改变,以对应于被平滑化了的音高序列的各时间的音高的值,对于音量序列也执行同样的处理,最终输出合成音。
- 音频合成装置及其音频合成的方法-201610345415.1
- 张戈 - 广州华多网络科技有限公司
- 2016-05-20 - 2019-10-25 - G10L13/033
- 本发明公开了一种音频合成装置及其音频合成的方法。该音频合成的方法包括:获取用户演唱的第一音频数据和原唱的第二音频数据;根据第一音频数据和第二音频数据获取音调差;判断音调差是否大于预设的阈值;若是,则将第一音频数据和第一音频数据进行合成。通过上述方式,本发明能够掩盖用户在演唱中跑调部分,提高用户的体验效果。
- 声音合成方法、声音合成装置和存储声音合成程序的介质-201610124952.3
- 才野庆二郎;若尔迪·博纳达;梅利因·布洛乌 - 雅马哈株式会社
- 2016-03-04 - 2019-10-22 - G10L13/033
- 本发明提供了声音合成方法、声音合成装置和存储声音合成程序的介质。一种声音合成方法,用于通过提取自参考声音的语音片段的连接而产生声音信号,所述方法包括:由片段选择单元顺序地选择所述语音片段;由音高设置单元设置音高过渡,在所述音高过渡中,根据与作为所述参考声音的声产生参考的参考音高和所述片段选择单元所选择的语音片段的观测音高之间的差值相对应的音级,来反映所述语音片段的观测音高的变动;以及由声音合成单元通过根据所述音高设置单元所产生的音高过渡而调整所述片段选择单元所选择的语音片段的音高,来产生所述声音信号。
- 音乐播放装置及方法-201610344934.6
- 赵婷婷 - 努比亚技术有限公司
- 2016-05-23 - 2019-09-20 - G10L13/033
- 本发明公开了一种音乐播放装置及方法,其装置包括:获取模块,用于在音乐播放器启动后,若接收到曲风变换指令,则获取曲风变换指令选择的曲风类型;提取模块,用于获取音乐播放器当前播放的音乐文件,提取当前播放的音乐文件中的背景音乐;变换模块,用于将当前播放的音乐文件中的背景音乐的曲风类型变换为曲风变换指令选择的曲风类型,以变换后的曲风播放所述音乐文件。本发明不需要浪费流量进行下载操作就可以随意变换音乐的曲风,满足用户对不同曲风进行变换的需求,极大的提升了用户体验。
- 一种语音声学特征扩大系统-201821986376.4
- 程冰 - 西安交通大学
- 2018-11-29 - 2019-09-13 - G10L13/033
- 本申请属于声音处理技术领域,特别是涉及一种语音声学特征扩大系统。在语言学习过程中,需要对语音声学特征进行扩大后为学习者制作出适合大脑感知的语料来刺激大脑。本申请提供一种语音声学特征扩大系统,包括语音获取单元,所述语音获取单元与语音处理单元相连接,所述语音处理单元与视频编辑单元相连接;其中,所述语音获取单元,用于对自然语音进行获取;所述语音处理单元,用于对自然语音中的频谱特征进行不同程度的扩大,以制作语料;所述视频编辑单元,用于将语音视频与处理过的语音编辑后合成视频片段。该语音声学特征扩大系统可以制作出更适合大脑感知的语料,从而帮助学习者在在大脑中形成更为接近母语者的语音范畴。
- 混响电路及其控制方法、芯片及装置-201910546933.3
- 李路;李国勇;张洁 - 上海矽诺微电子有限公司
- 2019-06-24 - 2019-08-30 - G10L13/033
- 本发明披露了一种混响电路及其控制方法、采用该电路的芯片及采用该芯片的装置,其中该电路为一种更简单的混响电路,能够实现混响阶数和混响深度可调的高质量混响效果。
- 文字信息处理装置及方法、计算机存储介质及移动终端-201711352721.9
- 林忠亿 - 富泰华工业(深圳)有限公司;鸿海精密工业股份有限公司
- 2017-12-15 - 2019-06-25 - G10L13/033
- 一种文字信息处理方法,应用于一文字信息处理装置中,所述文字信息处理装置存储有语音合成数据库,该方法包括:接收一文字信息并记录发信者;在所述语音合成数据库中查找所述发信者的个人语音数据;根据所述发信者的个人语音数据将所述文字信息转换为语音信息;及播放所述语音信息。本发明还提供一种实现上述文字信息处理方法的文字信息处理装置、计算机存储介质及移动终端。
- 语音播报方法和装置-201510535732.5
- 郭小华 - 百度在线网络技术(北京)有限公司
- 2015-08-27 - 2019-02-22 - G10L13/033
- 本发明提出一种语音播报方法和装置,其中,该语音播报方法包括:获得待播报的内容;从保存的语声素材中为所述待播报的内容选择对应的语声素材;使用选择的语声素材将所述待播报的内容转换为语音进行播报。本发明在有语音播报需求的场景下,可以从保存的语声素材中选择语声素材,使用选择的语声素材将待播报内容转化为语音进行播报,从而可以使用户有更多的语声素材的选择权,并且为待播报的内容选择的是与待播报的内容对应的语声素材,可以实现不同的待播报内容使用不同的语声素材,语声素材的使用方式灵活多变,提高了用户的体验度。
- 一种语音声学特征扩大系统-201811443497.9
- 程冰 - 西安交通大学
- 2018-11-29 - 2019-02-15 - G10L13/033
- 本申请属于声音处理技术领域,特别是涉及一种语音声学特征扩大系统。在语言学习过程中,需要对语音声学特征进行扩大后为学习者制作出适合大脑感知的语料来刺激大脑。本申请提供一种语音声学特征扩大系统,包括语音获取单元,所述语音获取单元与语音处理单元相连接,所述语音处理单元与视频编辑单元相连接;其中,所述语音获取单元,用于对自然语音进行获取;所述语音处理单元,用于对自然语音中的频谱特征进行不同程度的扩大,以制作语料;所述视频编辑单元,用于将语音视频与处理过的语音编辑后合成视频片段。该语音声学特征扩大系统可以制作出更适合大脑感知的语料,从而帮助学习者在在大脑中形成更为接近母语者的语音范畴。
- 一种语音处理方法及电子设备-201810857848.4
- 王丽娜 - 北京微播视界科技有限公司
- 2018-07-31 - 2018-12-18 - G10L13/033
- 本申请公开了一种语音处理方法及电子设备,该方法包括:对获取的预播报信息的内容进行语义识别;根据识别结果生成与所述预播报信息相对应的背景音频及语音信息;对所述背景音频及所述语音信息进行合成操作,生成与所述预播报信息相对应的播报音频。该语音处理方法能够对背景音频及语音信息进行合成操作,使得在对语音信息进行播报的同时还能够播放背景音频,增强用户体验。
- 基于模板的个性化歌唱合成的方法和系统-201380022658.6
- 李肇华;岑玲;李海州;陈耀柱;董明会 - 新加坡科技研究局
- 2013-03-06 - 2018-08-07 - G10L13/033
- 本发明提供了用于说话至歌唱合成的系统和方法。该方法包括获得第一个人的歌唱声音的特征以及响应于第一个人的歌唱声音的特征来修改第二个人的声音的声音特征,从而生成第二个人的合成歌唱声音。在一个实施方式中,该方法包括响应于第一个人的说话声音和歌唱声音获得第一说话特征和第一歌唱特征的模板以及从第二个人的说话声音提取第二说话特征,然后,根据模板修改第二说话特征来生成第二个人的近似歌唱声音,并响应于第一说话特征、第一歌唱特征以及第二说话特征来对齐第二个人的近似歌唱声音的声学特征,从而生成第二个人的合成歌唱声音。
- 语音信号的处理、实现多方通话的方法及装置、通信终端-201310204996.3
- 黄强;刘守华;胡家娟 - 展讯通信(上海)有限公司
- 2013-05-28 - 2017-12-26 - G10L13/033
- 一种语音信号的处理、实现多方通话的方法及装置、通信终端,所述语音信号的处理方法包括接收至少一个发送终端的语音信号;对第一语音信号进行第一音频处理,所述第一音频处理包括自动电平控制处理和采样频率转换处理中的至少一种,所述第一语音信号为从本地采集的待发送的语音信号和本地接收到的语音信号中选择的一路语音信号或者为从本地采集的待发送的语音信号和接收到的语音信号中选择的至少两路语音信号合成得到的信号。可有效解决多方通话过程中的爆音、破音等问题,实现在宽带和窄带不同采样率语音之间的多方通话,有效保证三方或者多方通话中高质量语音通话效果,且可以不通过网络运营商的增值服务即可实现多方通话,用户使用更方便。
- 基于文本到语音转换以及语义的音频人类交互证明-201380009453.4
- Y·钱;B·B·朱;F·K-P·宋 - 微软技术许可有限责任公司
- 2013-02-01 - 2017-09-01 - G10L13/033
- 本文所述的文本到语音转换音频HIP技术在一些实施例中使用经由文本到语音转换引擎生成的不同的相关或不相关的单词或句子作为音频HIP质询。该技术可在说出要被用作HIP质询串的句子的文本到语音转换合成器中应用不同的效应。这些不同的效应可包括例如谱频率翘曲;元音持续时间翘曲;背景添加;回声添加;以及改变单词间的持续时间等等。在某些实施例中,该技术改变该组参数来防止自动语音识别工具使用先前使用的音频HIP质询来习得可然后被用来识别由该技术生成的将来的音频HIP质询的模型。此外,在一些实施例中,该技术在HIP质询中引入语义理解的要求。
- 音频合成的方法和装置-201610006241.6
- 赵伟峰 - 广州酷狗计算机科技有限公司
- 2016-01-06 - 2017-07-14 - G10L13/033
- 本发明公开了一种音频合成的方法和装置。其中,该方法包括获取第一音频信号的第一音频特征值和第二音频信号的第二音频特征值,其中,第一音频特征值用于表征第一音频信号的音量特征,第二音频特征值用于表征第二音频信号的音量特征;使用第一音频特征值对预设的第一合成比例因子进行更新,得到第二合成比例因子,使用第二音频特征值对预设的第三合成比例因子进行更新,得到第四合成比例因子;按照第二合成比例因子和第四合成比例因子对第一音频信号和第二音频信号进行合成。本发明解决了合成声音文件时音量调节的过程比较繁琐的技术问题。
- 语音合成方法及语音合成装置-201611180346.X
- 石川克己;大岛治;赤泽英治;山本尚希;村上祐辉 - 雅马哈株式会社
- 2016-12-19 - 2017-06-27 - G10L13/033
- 本申请提供了语音合成方法及语音合成装置,其确定是否已经满足关于信息处理的预定条件,当已经满足该预定条件时改变发声字符,并且产生通过使已经改变的发声字符发声而获得的合成语音的声音信号。
- 合成声音的方法和装置-201610821199.3
- J.弗勒里奥;Y.拉菲尔;P.吉尔洛特尔 - 汤姆逊许可公司
- 2016-09-13 - 2017-06-13 - G10L13/033
- 一种合成声音的方法和装置,其中,获得表示在第一表面10上移动的第一对象13的速度的信息。所获得的速度信息与一个或多个基准声音一起使用以获得声音。所述一个或多个基准声音与在第二表面上移动的第二对象的位移的所确定的速度相关联,所述第一表面与所述第二表面不同。
- 稳定音色的音乐语音变调方法-201610573399.1
- 张栋;彭建云;余春艳;张为凡;刘宇欣 - 福州大学
- 2016-07-21 - 2016-12-14 - G10L13/033
- 本发明涉及一种稳定音色的音乐语音变调方法,利用语音信号可分为声门激励分量和声道冲激响应分量,通过语音信号的倒谱序列导出频谱包络,然后利用频谱包络分离出语音信号的激励分量,再将语音信号的激励分量通过变调算法处理改变其音高,最后将频谱包络和音高改变后的激励分量重新合成,得到音高改变但音色稳定的音乐语音信号。本发明所提出的一种稳定音色的音乐语音变调方法,该方法简单,实现灵活,具有较强的实用性。
- 一种基于指向目标人变声比例参数的语音变声方法及装置-201610036866.7
- 宁更新;钟英文;杨文圣;张军;冯义志;季飞 - 华南理工大学
- 2016-01-20 - 2016-06-08 - G10L13/033
- 本发明公开了一种基于指向目标人变声比例参数的语音变声方法及装置,获得使用者和特定目标人同一内容语音样本,根据声道建模模型,分别求得系统的极点,推导出两者语音之间的变声比例参数。随后输入该使用者待变声的一段语音,并根据建模模型和变声比例参数搬移极点,从而求得新的发音的系统模型,最后利用变声比例参数修正待变声语音激励的基音周期,并在新的声道系统中还原输出变声后的语音信号。本发明的装置具有可行性强、安装简单且设备成本低廉,可适用于多种语音变声应用场景等优点。
- 用于声学变换的系统和方法-201280037282.1
- 弗兰克·鲁德奇兹;格雷姆·约翰·赫斯特;帕斯卡尔·胡贝特·亨利·玛丽·范利斯豪特;杰拉尔德·布拉德利·佩恩;格雷厄姆·弗雷泽·沙因 - 索拉公司
- 2012-07-25 - 2014-10-01 - G10L13/033
- 本发明公开了声学变换的系统和方法。一个具体的实施例是:变换由具有语音障碍的说话者产生的声学言语信号以使得他们的话语更易于普通听众理解。这些改变包括:语速或节奏的修正、响音中的共振峰频率的调整、异常发声的去除或调整、音素插入错误的删除、以及错误丢弃音素的替换。这些方法还可以被应用于音乐序列或声学序列的一般修正。
- 语音合成装置和方法以及存储有语音合成程序的记录介质-201410098488.6
- 入山达也 - 雅马哈株式会社
- 2014-03-17 - 2014-09-17 - G10L13/033
- 公开了语音合成装置和方法以及存储有语音合成程序的记录介质,该语音合成装置包括:序列数据生成单元,被配置为生成序列数据,该序列数据包括用于控制要基于乐曲信息和歌词信息合成的语音的发声的多种参数;输出单元,被配置为基于序列数据输出歌唱语音;以及处理内容信息获取单元,被配置为获取多条处理内容信息。该多条处理内容信息与各条预设的歌唱方式信息相关联。多条处理内容信息中的每一条均表示用于多种参数的全部或部分的编辑处理的内容。序列数据生成单元生成多条序列数据。通过基于与用户指定的一条歌唱方式信息相关联的多条处理内容信息编辑序列数据中所包括的多种参数的全部或部分,来获得多条序列数据。
- 从统计文本到语音合成系统输出的语音的统计增强-201280033177.0
- A·索林;S·谢克特曼 - 国际商业机器公司
- 2012-06-28 - 2014-03-12 - G10L13/033
- 述一种用于增强由统计文本到语音(TTS)系统合成的语音的方法,所述系统在声学特征向量空间中采用语音的参数表示。所述方法包括:定义一系列参数纠正变换,所述纠正变换工作在所述声学特征向量空间中并依赖于一组增强参数;以及定义一个特征向量或多个特征向量的失真指示符。所述方法还包括:接收所述系统输出的特征向量;以及通过以下操作生成所述纠正变换的实例:计算所述失真指示符的参考值,所述参考值由发出所述特征向量的语音单位的统计模型产生;计算所述失真指示符的实际值,所述实际值由发出所述特征向量的所述语音单位的所述统计模型所发出的特征向量产生;根据所述失真指示符的所述参考值、所述失真指示符的所述实际值和所述参数纠正变换,计算增强参数值;以及从所述一系列参数纠正变换获得与所述增强参数值对应的所述纠正变换的实例。可以将所述纠正变换的所述实例应用于所述特征向量以提供增强的特征向量。
- 一种语音与音乐合成的方法、装置以及设备-201310359564.X
- 蒋金峰 - 北京奇艺世纪科技有限公司
- 2013-08-16 - 2013-12-11 - G10L13/033
- 本发明实施例提供了一种语音与音乐合成的方法、装置以及设备,其中,所述方法包括:获得输入的语音数据以及背景音乐数据;从所述语音数据识别出组成所述语音数据的一个或多个单字或单词,获得所述一个或多个单字或单词的音调及持续时长;获取所述背景音乐数据的音调及持续时长;按照所述背景音乐数据的音调及持续时长,对所述一个或多个单字或单词的音调及持续时长进行变速和/或变调处理;将所述处理后的语音数据及背景音乐数据合成为新的音频文件。本发明实施例可以将各个孤立的语音数据和音乐数据完美地“融合”在一起,将单调的语音数据赋予音乐属性,提高整个语流的质量,满足用户日益提高和变化的语音与音乐合成的需求。
- 一种基于受限玻尔兹曼机的联合频谱建模的声音转换方法-201310360234.2
- 刘利娟;陈凌辉;凌震华;戴礼荣 - 中国科学技术大学
- 2013-08-16 - 2013-11-27 - G10L13/033
- 一种基于受限玻尔兹曼机的联合频谱建模的声音转换方法,实现步骤为:提取语音频谱包络特征,提取语音高层频谱特征,动态时间规整,GMM模型训练,联合频谱包络特征声学子空间划分,Gaussian-Bernoulli RBM模型训练或Gaussian-Gaussian RBM模型训练,频谱转换和合成转换语音。本发明提高了频谱建模精度,改善转换语音的音质和自然度。
- 声音合成设备-201310104780.X
- 嘉山启;小笠原基 - 雅马哈株式会社
- 2013-03-28 - 2013-10-23 - G10L13/033
- 本发明提供了声音合成设备。该声音合成设备包括:耦接至存储器的处理器。该处理器被配置来执行计算机可执行单元,该计算机可执行单元包括:信息获取器,其适合于对指定了每个单位声音的持续时间和发音内容的合成信息进行获取;延长设置器,其适合于针对与每个单位声音的发音内容相对应的多个音素中的每一个来设置是允许延长还是禁止延长;以及声音合成器,其适合于通过连接与每个单位声音的发音内容相对应的多个声音分段来生成对应于所述合成信息的合成声音。所述声音合成器根据每个单位声音的持续时间来延长与允许延长的音素相对应的声音分段。
- 基于韵律特征参数和情感参数关联性的语音情感修正方法-201310100284.7
- 陈雁翔;龙润田 - 合肥工业大学
- 2013-03-26 - 2013-07-10 - G10L13/033
- 本发明公开了一种基于韵律特征参数和情感参数关联性的语音情感修正方法,该方法包括:对11类典型情感进行情感建模;对待修正的情感语音提取特征参数,并将其映射至情感空间内;利用情感参数和语音特征参数的关联关系,以及两类语音参数基于不同的信息度量间的互补性;通过情感参数对语音特征参数的修正获得更客观准确的情感表达。本发明方法能够更细致的获得所需合成的情感状态,自然度高,可广泛应用于语音处理与先进智能领域。
- 一种特定人语音合成技术在手机漫画配音中的应用方法-201210579314.2
- 唐义平;江源;孙见青;江涛;聂小林;徐佳佳 - 安徽科大讯飞信息科技股份有限公司
- 2012-12-27 - 2013-05-22 - G10L13/033
- 本发明公开了一种特定人语音合成技术在手机漫画配音中的应用方法,该方法在手机上接收用户输入的文字,通过特定人语音合成技术,生成模拟多种不同发音人音调和音色的音频数据,对图片或漫画进行配音;接收用户在手机上输入的文字,将文字通过特定人语音合成技术,并设置合成模版参数,实现各种模拟男女对话、老少对话等的合成音频,实现手机图片、漫画的配音。本发明将用户输入的文字,转化为指定人的声音甚至是自己亲属的声音,实现对手机图片、漫画的配音,增加了趣味性,提升了用户交互体验。
- 内置语音编辑播发的无线装置-201220366662.7
- 徐永兵;彭树林;张波权;夏华龙 - 上海埃威航空电子有限公司
- 2012-07-26 - 2013-03-06 - G10L13/033
- 本实用新型涉及一种内置语音编辑播发的无线装置,其特征在于:包括按键开关模块、用于存储包括英语或汉语普通话的词语的语音数据存储器、信息处理模块、信号调制模块和无线发送模块,信息处理模块分别与按键开关模块、语音数据存储器和信号调制模块连接,信号调制模块与无线发送模块连接。本实用新型提供的内置语音编辑播发的无线装置,能使操作人员通过简单的编辑操作,让无线电台发出格式化的、规范的语音信息,解决了操作人员不会使用英语或汉语普通话发出重要信息的困难。
- 专利分类