专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果18个,建议您升级VIP下载更多相关专利
  • [发明专利]音频信号的处理方法及装置,计算机存储介质及电子设备-CN201911239598.9有效
  • 方博伟 - 阿里巴巴集团控股有限公司
  • 2019-12-06 - 2023-10-17 - H04M9/08
  • 本申请公开一种音频信号的处理方法和装置,计算机存储介质和电子设备,其中处理方法包括:获取第一通信设备输入的包括有第一音频信号和第二音频信号的混合信号,以及来自第二通信设备的用于消除所述混合信号中回声信号的参考信号;根据所述参考信号,对所述混合信号进行相干性检测,获得所述参考信号和所述混合信号在相对应频带上的相干值;在向所述第二通信设备输出前,根据所述相干值对所述混合信号中相对应的所述频带上信号成分进行消除处理,获得处理后的目标音频信号;从而能够直接根据相干值对混合信号进行处理,过滤掉混合信号中的回声信号,保留近端人声信号,进而提高语音传输的音频信号质量。
  • 音频信号处理方法装置计算机存储介质电子设备
  • [发明专利]音频处理方法和音频处理设备-CN202310410915.9在审
  • 方博伟 - 阿里巴巴(中国)有限公司
  • 2023-04-13 - 2023-08-08 - G10L21/0316
  • 本公开涉及一种音频处理方法和音频处理设备。例如可以提供功能开关,以便由用户选择是否开启主讲人模式。响应于主讲人模式被开启,仅在主讲人讲话时,对所采集到的待处理音频数据进行语音增益处理。判断待处理音频数据的语音特征与主讲人的语音特征是否相匹配。在判定相匹配的情况下,对待处理音频数据进行语音增益处理。由此,在例如主讲人模式下,通过引入说话人识别,对主讲人的语音进行增益,而避免对非主讲人的语音进行增益,提升音视频沟通的体验。
  • 音频处理方法设备
  • [发明专利]音频质量的分析方法和装置、电子设备以及存储介质-CN202211739631.6在审
  • 方博伟;朋尔 - 阿里巴巴(中国)有限公司
  • 2022-12-30 - 2023-04-25 - G10L25/60
  • 本申请提供了一种音频质量的分析方法和装置、电子设备以及存储介质,依据本申请实施例,可以从多个维度直接对音频本身的质量进行准确分析。首先获取待分析的目标音频数据,然后对所获取的目标音频数据进行音频信号处理,以获得频带宽度扩大后的目标音频数据,从而可以提高质量分析的准确度,并实现多种频带宽度音频的质量分析。最后使用神经网络模型对目标音频数据进行音频分析,得到目标音频数据的音频分析信息,其中,音频分析信息包括多个质量分析维度下的分析结果。由于质量分析维度与影响音频质量的因素具有对应关系,因此可以根据所获得的分析结果排查影响音频质量的问题,定位影响音频质量的原因。
  • 音频质量分析方法装置电子设备以及存储介质
  • [发明专利]音频处理方法和装置、存储介质和电子设备-CN202210480907.7有效
  • 方博伟 - 阿里巴巴(中国)有限公司
  • 2022-05-05 - 2022-09-06 - G10L21/034
  • 本说明书实施方式涉及音频处理技术领域,具体涉及一种音频处理方法和音频处理装置,以及计算机可读存储介质和电子设备,解决了采用固定数字增益模式来调节的音频音量不稳定,用户体验差的问题。该音频处理方法,通过对数字增益后的信号进行基音周期检测,若根据基音周期检测的检测数据确定数字增益后的信号中存在语音信号,调节数字增益处理的增益数值。由于基音周期检测的检测频次较高,可以缩短确定数字增益后的信号中的语音信号的存在情况的时间,以快速调节数字增益处理的增益数值,加快了数字增益处理的增益数值的调节频率,甚至可以实时地针对数字增益后的信号的大小调节增益数值,提高了进行数字增益处理后的数字增益后的信号的稳定性。
  • 音频处理方法装置存储介质电子设备
  • [发明专利]音频处理方法、装置、电子设备及可读存储介质-CN202010507347.0在审
  • 方博伟 - 阿里巴巴集团控股有限公司
  • 2020-06-05 - 2021-12-07 - G10L21/0216
  • 本公开实施例公开了一种音频处理方法、装置、电子设备和可读存储介质。该音频处理方法包括:获取第一麦克风采集的第一音频数据和第二麦克风采集的与所述第一音频数据相对应的第二音频数据;确定所述第一音频数据和所述第二音频数据的主音源方位;基于所述第一音频数据、第二音频数据以及所述主音源方位确定目标噪音比,所述目标噪音比表示所述第一音频数据和所述第二音频数据各自的期望信号能量与非期望信号能量的比值;以及,基于所述目标噪音比,对所述第一音频数据和/或第二音频数据进行滤波并基于滤波后的第一音频数据和/或第二音频数据获取目标音频数据,提升了噪音参数的估计准确率,从而可以更好地从环境中提取期望音源的信号。
  • 音频处理方法装置电子设备可读存储介质
  • [发明专利]语音转换方法、装置、电子设备及可读存储介质-CN201710812770.X有效
  • 方博伟;张康;卓鹏鹏;张伟;尤嘉华 - 厦门美图之家科技有限公司
  • 2017-09-11 - 2021-08-20 - G10L21/013
  • 本发明提供一种语音转换方法、装置、电子设备及可读存储介质。所述方法包括基于预设切分规则将待转换语音切分为多个待转换帧单元;提取每个所述待转换帧单元的梅尔倒谱特征;根据音素字典及每个待转换帧单元的梅尔倒谱特征,计算得到多个候选帧单元;根据待转换说话人的帧单元与目标音色说话人的帧单元之间的对应关系,匹配得到目标帧单元;计算转换代价,得到最佳路径;对最佳路径上的目标帧单元进行处理,得到目标语音。该方法在音素字典中计算得到多个候选帧单元,相对于现有技术从整个技术特征字典中查找能节省计算资源提高计算速度,同时将传统的单帧的计算改进为多帧的计算,极大地改善了合成语音不连续,音质较差的技术问题。
  • 语音转换方法装置电子设备可读存储介质
  • [发明专利]一种基于双麦克风阵列的定向拾音方法及计算设备-CN201810070108.6有效
  • 方博伟;卓鹏鹏;张康;尤嘉华;张伟 - 厦门美图之家科技有限公司
  • 2018-01-24 - 2021-06-01 - G10L21/0216
  • 本发明公开了一种基于双麦克风阵列的定向拾音方法,其中双麦克风阵列包含第一麦克风和第二麦克风,通过第一麦克风获取第一声道的音频数据,通过第二麦克风获取第二声道的音频数据,包括步骤:对获取的第一声道的音频数据和第二声道的音频数据分别进行预处理,得到每个音频帧在第一声道的频谱及对应在第二声道的频谱;计算每个音频帧的入射角;根据每个音频帧的入射角计算该音频帧的目标噪音比;利用每个音频帧的入射角和目标噪音比计算该音频帧的滤波器系数;根据滤波器系数生成各音频帧的滤波后频谱;以及通过对滤波后频谱作逆傅里叶变换,来生成期望拾音范围内的音频数据的时域波形。本发明一并公开了用于执行上述定向拾音方法的计算设备。
  • 一种基于麦克风阵列定向方法计算设备
  • [发明专利]语音转换方法、装置、电子设备及可读存储介质-CN201710814245.1有效
  • 方博伟;卓鹏鹏;张康;尤嘉华;张伟 - 厦门美图之家科技有限公司
  • 2017-09-11 - 2021-01-29 - G10L25/18
  • 本发明提供一种语音转换方法、装置、电子设备及可读存储介质。方法包括基于预设切分规则将输入语音切分为多个帧单元;提取每个帧单元的梅尔倒谱特征和基频特征;将帧单元归类到相应的音素集合;根据帧单元的梅尔倒谱特征和平行训练得到的高斯混合模型参数,计算得到输出梅尔倒谱特征;根据输入语音帧单元基频,原始音素集合的基频特征和目标语音素集合的基频特征,计算得到输出基频;根据输出梅尔倒谱特征及输出基频计算得到输入语音转换后对应的输出语音。该方法不仅改善因忽略语音瞬时信息而导致的语音连续性差的缺点,还弥补整体训练的高斯混合模型导致的频谱细节缺失的问题,使得合成语音发音更准确,连续,以及韵律保持更完好。
  • 语音转换方法装置电子设备可读存储介质
  • [发明专利]语音数据处理方法、装置、电子设备及可读存储介质-CN201810049575.0有效
  • 卓鹏鹏;张康;方博伟;尤嘉华;张伟 - 厦门美图之家科技有限公司
  • 2018-01-18 - 2020-11-10 - G10L21/013
  • 本发明提供了一种语音数据处理方法、装置、电子设备及可读存储介质,涉及数据处理技术领域。该方法通过获得语音数据的初始频域参数;再获得与预设的目标MIDI音频对应的目标频域参数,然后根据所述目标频域参数对所述初始频域参数进行修改,得到变调后的语音数据。可以使语音数据中的语音具有目标MIDI音频的频域参数,使变调后的语音数据可以具有目标MIDI音频的音高特征,实现对语音数据的变调操作,可以实现不改变语音数据中语速和语音时长的情况下,对语音数据进行变调。变调后的语音数据的相位连续,不会出现噪音,同时能够避免出现机械音,变调效果更好。可以应用于歌曲中音高的修正,或人声到歌声的转换等,在声音处理领域具有较高的应用前景。
  • 语音数据处理方法装置电子设备可读存储介质
  • [发明专利]一种音色转换方法及计算设备-CN201710443089.2有效
  • 张康;方博伟;卓鹏鹏;尤嘉华;张伟 - 厦门美图之家科技有限公司
  • 2017-06-13 - 2020-05-15 - G10L21/007
  • 本发明公开了一种音色转换方法,该方法适于根据待处理语音的音素从预置的源‑目标音素特征单元对中搜索匹配的语音进行转换,包括步骤:提取待处理语音中每一帧语音的特征;计算待处理语音中每一帧语音所属音素,将同一音素内的连续帧作为一个音素集;按顺序将一个音素集分成一个或多个第一帧长的音素单元,其中相邻音素单元之间相互重叠第二帧长;根据每帧语音的特征拼接得到对应音素单元的特征;对于每个音素单元,根据其音素和特征从源‑目标音素特征单元对中选取出代价最小的目标音素特征单元,作为最优音素特征单元;对多个音素单元对应的多个最优音素特征单元进行时域拼接处理,得到音色转换后的语音。本发明一并公开了相应的计算设备。
  • 一种音色转换方法计算设备
  • [发明专利]音频信号的补偿方法、装置及系统-CN201710608349.7有效
  • 胡瑞敏;王晓晨;徐家望;张茂胜;方博伟;覃景繁;李贤胜 - 华为技术有限公司;武汉大学
  • 2017-07-24 - 2020-04-14 - H04R3/00
  • 本申请公开了一种音频信号的补偿方法、装置及系统,属于声学技术领域。该方法包括:获取音频播放空间内设置的M个扬声器与该音频播放空间内L个接收点之间的该音频播放空间的房间脉冲响应矩阵;计算该M个扬声器中每个扬声器所播放的声音在该L个接收点中每个接收点处的理论声压值,得到理想声场矩阵;根据该房间脉冲响应矩阵和该理想声场矩阵,计算滤波系数;采用该滤波系数对M路音频信号进行补偿,得到M路补偿信号。利用该计算得到的滤波系数对音频信号进行补偿,可使得经过扬声器输出的音频信号的实际声场在一定程度上逼近理想声场,消除该音频播放空间内反射声带来的声染色问题,从而有效改善音频播放空间内音响系统的音响效果。
  • 音频信号补偿方法装置系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top