[发明专利]基于音频输入的动态调适音调校正有效
申请号: | 201310717160.3 | 申请日: | 2013-12-23 |
公开(公告)号: | CN103903628B | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | P.R.卢皮尼;G.A.拉特利奇;N.坎贝尔 | 申请(专利权)人: | 哈曼国际工业有限公司 |
主分类号: | G10L21/007 | 分类号: | G10L21/007 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 高巍 |
地址: | 美国康*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种用于调整音频信号的音调的系统和方法,该方法包括:检测所述音频信号中的输入音符、将所述输入音符映射到相应的输出音符,每个输出音符具有相关联的上音符边界和下音符边界以及响应于先前接收到的输入音符来修改至少一个输出音符的所述上音符边界和所述下音符边界中的至少一个。所述输入音符的音调可被转变以匹配相应的输出音符的相关联的音调。基于检测到的所述输入音符的稳定性来动态地调整所述音调转变过程的延迟。 | ||
搜索关键词: | 基于 音频 输入 动态 调适 音调 校正 | ||
【主权项】:
1.一种用于处理声乐信号和非声乐信号的方法,其包括:检测所述声乐信号中的声乐输入音符;基于每个检测到的声乐输入音符出现的次数生成出现声乐输入音符的可能性;检测所述非声乐信号中的非声乐输入音符;基于每个检测到的非声乐输入音符出现的次数生成出现非声乐输入音符的可能性;将所述出现声乐音符的可能性和所述出现非声乐音符的可能性进行组合以生成组合的出现音符的可能性;基于相关联的上音符边界和下音符边界将所述声乐输入音符映射到相应的声乐输出音符;将所述声乐输入音符的音调转变成与所述相应的声乐输出音符相关联的音调;以及响应于所述组合的出现音符的可能性而调整所述上音符边界和所述下音符边界。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈曼国际工业有限公司,未经哈曼国际工业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310717160.3/,转载请声明来源钻瓜专利网。
- 同类专利
- 基于音频输入的动态调适音调校正-201310717160.3
- P.R.卢皮尼;G.A.拉特利奇;N.坎贝尔 - 哈曼国际工业有限公司
- 2013-12-23 - 2019-11-12 - G10L21/007
- 本发明提供了一种用于调整音频信号的音调的系统和方法,该方法包括:检测所述音频信号中的输入音符、将所述输入音符映射到相应的输出音符,每个输出音符具有相关联的上音符边界和下音符边界以及响应于先前接收到的输入音符来修改至少一个输出音符的所述上音符边界和所述下音符边界中的至少一个。所述输入音符的音调可被转变以匹配相应的输出音符的相关联的音调。基于检测到的所述输入音符的稳定性来动态地调整所述音调转变过程的延迟。
- 一种处理语音数据的方法、装置、设备及可读存储介质-201810489675.5
- 冯来见;张锦华 - 广州国视科技有限公司
- 2018-05-21 - 2019-10-25 - G10L21/007
- 本发明公开了一种处理语音数据的方法,包括:获取目标语音文件的频谱图并展示;接收用户在频谱图中选取的目标频率范围,并根据目标频率范围确定对应的目标语音数据;提取目标语音数据,并对目标语音数据进行处理后,播放目标语音数据。该方法可使用户根据目标语音文件的频谱图自主选择特定目标频率范围,且由于用户是根据频谱图选取的语音数据,所以选取的语音数据的质量更佳,也无需对其降噪处理,从而不会影响原来的语音音频的质量,使得播放的语音音频更佳清晰;同时,由于选取的语音数据量较小,也提高了语音数据的处理效率。相应地,本发明公开的一种处理语音数据的装置、设备及可读存储介质,也同样具有上述技术效果。
- 用于生成信息的方法和装置-201810366503.9
- 孙建伟;李超;李鑫;朱唯鑫;文铭 - 百度在线网络技术(北京)有限公司
- 2018-04-23 - 2019-10-22 - G10L21/007
- 本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取信噪比映射矩阵,其中,信噪比映射矩阵是基于加噪语音数据集合中的至少一条加噪语音数据的幅值分布信息和在真实场景下采集到的至少一条远场语音数据的幅值分布信息生成的矩阵,加噪语音数据是通过对近场语音数据进行加噪处理得到的;将加噪语音数据集合中的加噪语音数据作为待处理语音数据,执行以下生成步骤:确定与待处理语音数据对应的、用于表征待处理语音数据的幅值分布信息的第一向量;确定信噪比映射矩阵与第一向量的乘积,基于乘积生成远场仿真语音数据。该实施方式实现了具有较高有效性的远场仿真语音数据的生成。
- 声音转换方法和装置-201510676304.4
- 陈凌辉;张卫庆;江源;杨浦;潘青华;胡国平;胡郁;刘庆峰 - 科大讯飞股份有限公司
- 2015-10-14 - 2019-10-18 - G10L21/007
- 本发明提出一种声音转换方法和装置,该声音转换方法包括预先构建声音转换模型;接收源发音人的语音信号,并提取语音信号的频谱特征;确定源发音人对应的声音转换模型;根据频谱特征和源发音人对应的声音转换模型,进行声音转换,以得到目标发音人的语音信息。该声音转换方法能够有效提高声音转换的灵活性。
- 一种语音处理的方法、装置及电子设备-201711071260.8
- 潘虹 - 珠海格力电器股份有限公司
- 2017-11-03 - 2019-10-11 - G10L21/007
- 本发明实施例涉及通信技术领域,公开了一种语音处理方法、装置及电子设备。其中所说的语音处理的方法包括:获取待处理语音;接收对所述待处理语音的语音修正指令;根据所述语音修正指令,获取预设语音参数值;若所述预设语音参数值与所述待处理语音的语音参数不匹配,根据所述预设语音参数值,对所述待处理语音的语音参数进行修正,得到处理后的语音;将所述处理后的语音发送至通信方的电子设备。通过以上方式,本发明实施例对用户的语音进行修饰,生成美化的语音,有效地满足了用户对美化语音的需求,极大地提高了语音播放的听觉感受。
- 基于Tensorflow的语音融合方法、电子装置及存储介质-201910566906.2
- 张鹏 - 平安科技(深圳)有限公司
- 2019-06-27 - 2019-10-01 - G10L21/007
- 本发明涉及人工智能技术领域,本发明提出一种基于Tensorflow的语音融合方法、电子装置及计算机可读存储介质,其中的方法包括:将内容语音浮点数据和风格语音浮点数据通过STFT等变化转换成内容语音频谱图和风格语音频谱图;通过过滤器模板分别对两种语音频谱图进行特征提取,获取两种语音的声学特征,并创建loss函数;通过Tensorflow的优化器对loss函数进行迭代优化,当loss函数的差值最小时,确定待融合的内容语音数据和风格语音数据;将待融合的语音数据进行ISTFT等变换;通过librosa将ISTFT等变换处理后的待融合的内容语音数据和风格语音数据合成MP3格式的语音。本发明通过基于Tensorflow将不同风格的语音融合在一起,为说话声自动增加背景音乐、智能创造新音乐,从而为用户提供更多地体验。
- 一种音频链路架构预处理的多段压限器设计方法-201910362145.9
- 方韶劻;卜玉婷;林凤梅;曾庆宁;张洋;韦莎丽;刘帅;何彦兴 - 深圳市昂思科技有限公司
- 2019-04-30 - 2019-08-23 - G10L21/007
- 本发明公开了一种音频链路架构预处理的多段压限器设计方法,通过前端音频预处理衰减大信号,在设计多段压限器时采用级联两个二阶巴特沃斯滤波器构造四阶林奎茨‑瑞利滤波分频器以实现幅度响应在交叉处为‑6 dB即在分频点处没有凸起,同时采用多段压缩可以根据不同频段的信号特点合理设置压缩器参数,使得在进行音频处理时获得令人满意的音效。本发明对音频信号进行压缩效果器处理中因大幅度的压缩和限制而产生的抽吸效应以及快速建立时间和恢复时间所带来的低频失真和可闻的咔嗒声有一定的改善作用,使得在进行音频处理时获得令人满意的音效。
- 语音信号处理装置及语音信号处理方法-201510294353.1
- 杜博仁;张嘉仁;曾凯盟 - 宏碁股份有限公司
- 2015-06-02 - 2019-08-06 - G10L21/007
- 本发明提供一种语音信号处理装置及语音信号处理方法。依据在第m‑1个原始降频信号框中与第m‑1个更新降频信号框的中间取样点所对应的相位基准取样点编号决定在第m个原始降频信号框中与相位基准取样点编号对应的取样点相位匹配的第一个取样点。将此第一个取样点起的连续q个取样点作为第m个更新降频信号框的取样点,以在对取样语音信号做进一步的降频(例如将频率降为四分之一)时,仍可有效地改善信号框重叠时相位不匹配所导致的信号失真情形。
- 一种音频处理方法及装置-201611028097.2
- 张家重;董毅;李光瑞 - 浪潮金融信息技术有限公司
- 2016-11-14 - 2019-08-02 - G10L21/007
- 本发明提供了一种音频处理方法及装置,该方法包括:构建虚拟空间,建立所述虚拟空间与实际空间之间的对应关系;还包括:确定至少一个音源,并在设定时间段内,采集所述实际空间中每一个所述音源产生的音频数据以及运动轨迹;根据所述对应关系,将采集到的至少一个所述运动轨迹添加到所述虚拟空间;在所述虚拟空间中,确定目标对象的位置;根据所述目标对象的位置和每一个所述运动轨迹,处理每一个所述音频数据。本发明提供的方案实现了按照用户的位置处理音频数据。
- 一种音频处理方法和音频处理装置-201410629188.6
- 王丛华 - TCL集团股份有限公司
- 2014-11-07 - 2019-07-19 - G10L21/007
- 本发明公开了一种音频处理方法和音频处理装置,其中,一种音频处理方法包括:获取需要处理的音频数据;对音频数据依次进行高通滤波处理和增益控制处理,得到音频数据的高频分量;对音频数据依次进行低通滤波处理和增益控制处理,得到音频数据的低频分量;获取该低频分量的前N位数值,并将前N位数值中的前N/2位数值和后N/2位数值分别与传递系数进行卷积运算处理后求和并进行M阶滤波运算,得到低频分量的高频段数据;生成高频段数据的一次谐波和二次谐波并进行卷积运算处理,得到虚拟低音数据;将上述音频数据的高频分量和虚拟低音数据进行逻辑加法运算后输出处理后的音频数据;本发明提供的技术方案能够有效提高音频的低音效果。
- 一种修复输入语音的方法及其装置-201410462543.5
- 陈紫微 - 阿里巴巴集团控股有限公司
- 2014-09-11 - 2019-07-12 - G10L21/007
- 本申请提供一种修复输入语音的方法及其装置,所述方法包括:根据预设的语音识别库对接收的输入语音中的语音字段进行识别,确定所述输入语音中是否存在待修复的语音字段;如所述输入语音中存在待修复的语音字段,则从所述预设的语音识别库中获取与所述待修复的语音字段相匹配的纠正语音字段;以及将所述纠正语音字段替换所述输入语音中的待修复语音字段,得到修复后的输入语音。本申请对输入语音进行修复,保证了输入语音的完整性。
- 用于音频的动态混响处理方法及装置-201910055474.9
- 魏耀都;牛继华 - 北京小唱科技有限公司
- 2019-01-21 - 2019-05-31 - G10L21/007
- 本申请公开了一种用于音频的动态混响处理方法及装置。该方法包括获取演唱歌曲的特征参数;以及根据所述演唱歌曲的特征参数,动态调整混响模拟器中的混响属性。本申请解决了对应音频的混响处理无法随时间变换的技术问题。通过本申请的可以对不同的歌曲动态实现较好的混响音色以及持续时间调整,从而可以实现更为专业的混音效果。此外,本申请适用于唱歌类应用。
- 语音转换方法、装置、设备及存储介质-201811604615.X
- 陈云琳;刘冰 - 出门问问信息科技有限公司
- 2018-12-26 - 2019-04-16 - G10L21/007
- 本公开提供了一种语音转换方法,包括:获取源说话人的预定数量的语音及目标说话人的预定数量的语音;基于所获取的源说话人的语音的特征参数及目标说话人的语音的特征参数来进行训练,以得到训练模型的转换函数;从源说话人的实时语音中提取特征参数,通过训练模型的转换函数将所提取的源说话人语音特征参数转换成目标说话人语音特征参数;以及根据转换后的目标说话人语音特征参数,得到目标说话人的语音。本公开还提供了一种语音转换装置、电子设备及可读存储介质。
- 音效模拟方法、装置、介质及电子设备-201811447215.2
- 耶尔马科夫维克多 - 网易(杭州)网络有限公司
- 2018-11-29 - 2019-04-05 - G10L21/007
- 本发明实施例提供了一种音效模拟方法、装置、介质及电子设备,涉及信号处理技术领域。该音效模拟方法包括:获取预设啁啾信号;控制目标终端播放预设啁啾信号;控制预设音频录制设备录制所述目标终端播放的内容以获得录音音频;对所述录音音频进行反卷积,获得所述录音音频对应的脉冲响应文件;利用所述脉冲响应文件模拟所述目标终端的声音效果。本发明实施例的技术方案可以提高音效模拟的仿真度。
- 一种数据处理方法及其终端-201510870232.7
- 赵伟峰;孔令城 - 腾讯科技(深圳)有限公司
- 2015-12-01 - 2019-03-15 - G10L21/007
- 本发明实施例公开了一种数据处理方法及其终端;其中,所述方法包括:检测到数据处理策略需要切换时,获取数据处理策略切换前对应的目标音频数据;利用数据处理策略切换前对应的第一处理策略对所述目标音频数据进行数据处理,得到第一处理数据;利用数据处理策略切换后对应的第二处理策略对所述目标音频数据进行数据处理,得到第二处理数据;根据所述第一处理数据和所述第二处理数据确定出与所述目标音频数据对应的输出音频数据,以使确定出的所述输出音频数据与预期目标输出音频数据所能达到的音效一致。
- 一种基于深度学习的音质特性处理方法及系统-201810583119.4
- 姚青山;秦宇;喻浩文;卢峰;阳萌 - 安克创新科技股份有限公司
- 2018-06-05 - 2019-01-04 - G10L21/007
- 本发明提供一种基于深度学习的音质特性处理方法及系统。所述方法包括:对包含待处理音频数据的用户偏好数据进行特征提取得到所述待处理的音频数据的数据特征;基于所述数据特征,利用训练好的基线模型,生成所述待处理的音频数据的音质处理结果;所述基线模型是利用广泛大众或单个用户的音频数据,行为数据及其他相关数据训练得到的神经网络模型。根据本发明方法及系统,基于深度学习方法对音质特性进行处理的方法,并利用用户反馈数据进行模型在线学习,实现用户个性化音质调节。
- 通话方法、移动终端及计算机可读存储介质-201811134863.2
- 王继雷 - 南昌努比亚技术有限公司;努比亚技术有限公司
- 2018-09-27 - 2018-12-21 - G10L21/007
- 本发明公开了一种通话方法、移动终端及计算机可读存储介质,所述通话方法包括:当与通话请求的发起端建立通话连接时,检测所述发起端是否为目标发起端;若所述发起端不为目标发起端,则获取所述发起端发送的第一语音信息;检测所述第一语音信息对应的发声对象是否为标记对象;若所述第一语音信息对应的发声对象为标记对象,则按照所述标记对象对应的语音处理策略,对语音采集装置采集的第二语音信息进行处理,得到第三语音信息,并将所述第三语音信息发送至所述发起端。通过本发明,实现了根据用户需求制定通话场景。
- 基于小波变换的高质量声音变换方法-201810234234.0
- 罗森林;张寒青;潘丽敏;袁晓筱 - 北京理工大学
- 2018-03-21 - 2018-09-04 - G10L21/007
- 本发明针对传统实时变声算法如WSOLA算法等复杂度高、实时性差和转换语音质量低的问题,提出了基于小波变换的高质量声音变换方法。首先运用重采样的方法对原始语音信号先进行变调处理,变调后的语音信号时长会发生改变。然后对变调后的语音信号进行预加重、分帧和加窗处理。接着通过小波变换的方法获得当前帧的语音特征。根据该特征,对语音信号的转折部分做出检测与确定,通过保留转折区语音信号不变的方式提高语音信号的感知度。最后,为了提高语音转换的实时性,采用了点采样的方式进行语音规整完成语音转换。
- 音频内容修正的方法及其智能装置-201711269934.5
- 王国腾 - 北京小唱科技有限公司
- 2017-12-05 - 2018-07-06 - G10L21/007
- 本申请公开了一种音频内容修正的方法及其智能装置,包括:采集用户演唱的音频信息,对所述音频信息进行基频分析得到基频特征,对所述音频信息进行节奏分析得到节奏特征,对所述节奏特征与模版进行比对,得到时间偏移量序列,对所述基频特征根据时间偏移量序列与模版进行比对,得到音高差序列,对所述用户音频信息,根据时间偏移量序列和音高差序列进行变调变速处理,得到修正后的音频。通过对节奏和音高的分别修正,进而解决了相关技术中在整体分析时的一条时间轴上节奏与音高互相干扰无法得到准确修正的技术问题。
- 一种基于直播声卡功能的自拍杆-201721391167.0
- 苏攀;苏少爽;吴源 - 深圳市创成微电子有限公司
- 2017-10-26 - 2018-05-25 - G10L21/007
- 本实用新型涉及一种基于直播声卡功能的自拍杆,包括手持部、伸缩部与卡持部,所述的手持部与卡持部通过伸缩部连接在一起,所述的手持部内设置有音频处理装置,所述的音频处理装置包括第一音频输入接口、音频处理电路以及第一音频输出接口,所述的第一音频输入接口与所述的音频处理电路电性连接,所述的音频处理电路还电性连接所述的第一音频输出接口,本实用新型通过在手持部设置音频处理装置来实现对音频的处理且具有丰富的音频处理模式,从而实现方便自由的户外、移动直播,同时本实用新型又设置有电池,即可为外部设备供电以及充电,而卡持部背板的无线充电器结构又可实现外部设备的无线充电,不用为直播设备的电量续航而担忧。
- 音频转换方法及装置-201711020968.0
- 齐路;颜钊;张姗姗 - 北京奇虎科技有限公司
- 2017-10-25 - 2018-03-20 - G10L21/007
- 本发明涉及计算机技术领域,公开了一种音频转换方法及装置,该音频转换方法包括接收用户触发的音频转换请求,获取所述音频转换请求中携带的待转换音频信息和目标音频标识信息;对所述待转换音频信息进行音素特征提取,得到待转换音素特征信息;根据预设的音频转换处理模块集合对所述待转换音素特征信息进行音频转换,将所述待转换音素特征信息转换为与所述目标音频标识信息对应的目标音频信息相同的目标特征信息,得到所述目标音频信息。本发明中,实现了对待转换音频的转换处理,提高了对音频信息的转换精准度,进而提升以及丰富了用户的使用体验感受。
- 基于音色的音频转换方法及装置-201711008258.6
- 齐路;颜钊;张姗姗 - 北京奇虎科技有限公司
- 2017-10-25 - 2018-03-06 - G10L21/007
- 本发明涉及计算机技术领域,公开了一种基于音色的音频转换方法及装置,该基于音色的音频转换方法包括获取待转换音频信息和目标音频标识信息;对所述待转换音频信息进行特征提取,得到待转换特征信息;根据预设的音色转换处理模块对所述待转换特征信息进行音色转换,将所述待转换特征信息转换为与所述目标音频标识信息对应的目标音频信息音色相同的目标特征信息,得到与所述目标音频信息音色相同的音频信息。本发明中,实现了对待转换音频的转换处理,提高了对音频信息的转换精准度,进而提升以及丰富了用户的使用体验感受。
- 一种基于直播声卡功能的自拍杆-201711013585.0
- 苏攀;苏少爽;吴源 - 深圳市创成微电子有限公司
- 2017-10-26 - 2018-02-02 - G10L21/007
- 本发明涉及一种基于直播声卡功能的自拍杆,包括手持部、伸缩部与卡持部,所述的手持部与卡持部通过伸缩部连接在一起,所述的手持部内设置有音频处理装置,所述的音频处理装置包括第一音频输入接口、音频处理电路以及第一音频输出接口,所述的第一音频输入接口与所述的音频处理电路电性连接,所述的音频处理电路还电性连接所述的第一音频输出接口,本发明通过在手持部设置音频处理装置来实现对音频的处理且具有丰富的音频处理模式,从而实现方便自由的户外、移动直播,同时本发明又设置有电池,即可为外部设备供电以及充电,而卡持部背板的无线充电器结构又可实现外部设备的无线充电,不用为直播设备的电量续航而担忧。
- 面向用户体验的音频信号处理-201410562080.X
- 马桂林;郑羲光;张晨;孙学京;C·鲍尔 - 杜比实验室特许公司
- 2014-10-17 - 2016-08-24 - G10L21/007
- 本发明的实施例涉及用于面向用户体验的音频信号处理。提供了一种用于面向用户体验的音频信号处理的方法。该方法包括:获取来自电子设备的音频传感器的第一音频信号;基于第一音频信号计算针对从电子设备到收听者的声学路径的补偿因子;以及将补偿因子应用于将从电子设备输出的第二音频信号。还公开了相应的系统和计算机程序产品。
- 一种基于智能终端的实时变声方法-201510599104.3
- 邹永杭;朱汉坤;张南;刘恒;宋志东;邵忠 - 深圳市海派通讯科技有限公司
- 2015-09-18 - 2016-02-03 - G10L21/007
- 本发明提供了一种基于智能终端的实时变声方法,包括以下步骤:S1、语音信号读入;S2、汉明窗加权语音;S3、计算线性预测系统A;S4、计算激励、滤波,重建语音作为测试对比用;S5、根据激励计算基频和合成激励能量;S6、根据变频系数α改变基频频率;S7、根据预测系统求极点;S8、移动极点改变极点角度ω改变共振峰频率;S9、根据新极点求出新系数A1;S10、根据新基频、新系数A1,计算出合成激励、插值抽值,计算出合成语音;S11、输出变声后的语音信号。本发明的有益效果是:可实现实时变声,适用于实时语音交流。
- 一种语音处理方法以及一种电子设备-201410111913.0
- 罗曦;于泳 - 联想(北京)有限公司
- 2014-03-24 - 2015-09-30 - G10L21/007
- 本申请公开了一种语音处理方法以及一种电子设备,所述方法应用于电子设备,所述电子设备包括第一语音播放装置和第二语音播放装置,所述方法包括:获得用户的位置信息;基于所述位置信息,获得音频信号的第一调整参数和第二调整参数;基于所述第一调整参数调整所述音频信号,获得第一语音;基于所述第二调整参数调整所述音频信号,获得第二语音;使用所述第一语音播放装置播放所述第一语音,且使用所述第二语音播放装置播放所述第二语音,以使所述第一语音和所述第二语音在传递到所述用户时具有相同的特征参数。
- 音频数据的处理方法及装置-201510069567.9
- 田彪 - 百度在线网络技术(北京)有限公司
- 2015-02-10 - 2015-06-17 - G10L21/007
- 本发明提供一种音频数据的处理方法及装置。本发明实施例由于将高频段的音频数据即扩展音频数据增加到原始音频数据中,使得所获得的目标音频数据不再只具有低频段的音频数据即原始音频数据,而且还具有高频段的音频数据,这样,才能够向用户提供真正的高音质的音频文件,使用户能够欣赏真正的高音质的音频文件。
- 一种基于混合高斯随机过程的分簇语音转换方法及系统-201410662811.8
- 徐宁;胡芳;蒋爱民;刘小峰 - 河海大学常州校区
- 2014-11-19 - 2015-03-25 - G10L21/007
- 本发明涉及一种基于混合高斯随机过程的分簇语音转换方法及系统,本分簇语音转换方法包括:步骤S100,训练阶段,即将源、目标语音数据分别进行特征参数提取后进行训练;以及步骤S200,转换阶段,即将再次提取的源的特征参数与训练结果进行转换,并合成得到重构的语音数据;本分簇语音转换方案适用于大数据量环境下,即数据之间具有很强的关联性和重叠性;就中文语音而言,表面变化丰富的语音下,其本质构成的语音元数据是有限的;因此,通过建立具有混合结构的语音转换方法,可以对语音数据进行分簇建模,从而充分利用大数据,提高系统性能。
- 一种移动手机特定连续语音过滤方法及过滤装置-201410112404.X
- 汪金辉;龙哲华;侯立刚;耿淑琴;彭晓宏;宫娜 - 北京工业大学
- 2014-03-25 - 2014-06-18 - G10L21/007
- 一种移动手机特定连续语音过滤方法及过滤装置,属于通讯方法及设备技术领域。通过使用者使用此功能时,先录入用户语音,在移动手机内记录一个已识别特定语音,建立一个移动手机的语音库;每次使用移动手机进行通话,用户可以选择手机只识别特定语音。通过本发明,在嘈杂的环境下通话,可以有效的解决在这种环境下通话的不便性,也可以保证通话的另一端,能听到高质量的语音通话,当然这个功能使用时,也可以让移动手机只通过用户自己的语音,可以不让身边其他人的话语传递到另一方,在保护用户隐私方面同样有着很广泛的适用性。
- 一种孤立音节基频曲线中的野值修改算法-201310186080.X
- 毛峡;魏鹏飞 - 北京航空航天大学
- 2013-05-20 - 2013-10-02 - G10L21/007
- 本发明提出了一种修改孤立音节基频曲线中的野值的方法,该方法为:提出了孤立音节基频曲线分段模型;设计了一种逐点修改第一类野值与移除第二类野值的算法,该算法首先通过统计的方法确定修改第一类野值的修改起始点,然后利用半频,倍频及其相关组合对修改起始点与修改结束点之间的基频曲线进行基频值修改;其次,移除首尾部分的第二类野值,通过Viterbi分割将基频曲线分割为若干段并设计了最终基频曲线决策,得到最终基频曲线。设计了3组评价实验,包括主观评测实验,客观参数评价实验与音节声调识别对比实验。实验结果表明,修改后的基频曲线比原始基频曲线更光滑且更符合基频变化的趋势。
- 专利分类