[发明专利]电子设备、方法和计算机程序在审

专利信息
申请号: 202080009670.3 申请日: 2020-01-23
公开(公告)号: CN113348508A 公开(公告)日: 2021-09-03
发明(设计)人: 斯特凡·乌利希;迈克尔·埃嫩克尔 申请(专利权)人: 索尼集团公司
主分类号: G10L21/0272 分类号: G10L21/0272;G10L25/48;G11B27/031;G10H1/00;G10L19/025
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 吴孟秋
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种包括电路的电子设备,该电路被配置为:基于接收的音频输入来执行(402;702;1204)源分离(201)以获得分离源;对分离源执行起始检测(202)以获得起始检测信号;并且基于起始检测信号将音频信号与分离源混合(405;706;1207)以获得增强的分离源。
搜索关键词: 电子设备 方法 计算机 程序
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼集团公司,未经索尼集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202080009670.3/,转载请声明来源钻瓜专利网。

同类专利
  • 用于讲话者无关的多讲话者语音分离的置换不变训练-201780030696.4
  • 俞栋 - 微软技术许可有限责任公司
  • 2017-05-06 - 2023-08-29 - G10L21/0272
  • 本文描述的技术改进了使计算设备能够在与讲话者无关的多讲话者场景中进行自动语音识别(“ASR”)的方法。在一些示例中,深度学习模型的置换不变训练可以用于与讲话者无关的多个讲话者场景。在一些示例中,该技术可以确定模型对源信号的估计与源信号之间的置换考虑的分配。在一些示例中,该技术可以包括训练生成估计的模型以最小化置换考虑的分配的偏差。这些技术可以实现为神经网络的结构本身,解决了标签置换问题,标签置换问题阻碍了基于深度学习的语音分离技术的进步。这里讨论的技术还可以包括源追踪以在混合信号的帧中追踪源自相同源的流。
  • 处理声音数据以分离多声道信号中的声源-201880037758.9
  • M.巴奎;A.格林 - 奥兰治
  • 2018-05-24 - 2023-08-15 - G10L21/0272
  • 本发明涉及一种用于处理声音数据以分离在真实介质中感测到的多声道声音信号的N个声源的方法。该方法包括以下步骤:将源分离处理应用(E310)于所感测到的多声道信号,并获得分离矩阵和一组M个声音分量,其中,M≥N;计算(E320)一组所谓的双变量第一描述符,该组所谓的双变量第一描述符表示所获得的该组M个分量的对中的分量之间的统计关系;计算(E320)一组所谓的单变量第二描述符,该组所谓的单变量第二描述符表示所获得的该组M个分量中的分量的编码特性;以及根据该组第一描述符和该组第二描述符、通过对属于两个类别之一中的成员的概率的计算(E330)、根据分量的这两个类别来将该组M个分量中的分量进行分类(E340),第一类别具有对应于这N个直接声源的N个所谓的直接分量,并且第二类别具有M‑N个所谓的混响分量。本发明还涉及一种实施比如所描述的方法的处理设备。
  • 信号处理装置、信号处理方法和程序-202180073904.5
  • 高桥直也 - 索尼集团公司
  • 2021-10-07 - 2023-06-30 - G10L21/0272
  • 本发明提供了一种信号处理装置,例如,其执行适当的声源分离处理。该信号处理装置具有:下变频器,其将下采样处理应用于混合有包含高于预定频率的谐波分量的声源信号的混合声音信号;掩码生成单元,其基于通过下变频器的下采样处理结果生成掩码;以及掩码处理单元,其将由掩码生成单元生成的掩码应用于混合声音信号。
  • 声源分离装置和方法以及程序-201780053674.X
  • 高桥直也;光藤祐基;斯特凡·乌利希;迈克尔·伊南科尔;托马斯·坎普 - 索尼公司
  • 2017-08-25 - 2023-06-16 - G10L21/0272
  • 本技术涉及能够实现更高分离性能的声源分离装置、方法和程序。该声源分离装置包括组合单元,该组合单元将预定声源的第一声源分离信号与声源的第二声源分离信号组合,第一声源分离信号由第一声源分离系统从混合声音信号中分离出来,第二声源分离信号由第二声源分离系统从混合声音信号中分离出来,在预定时间单位内,第二声源分离系统的分离性能不同于第一声源分离系统;并且输出通过所述组合获得的声源分离信号。本技术可应用于声源分离装置。
  • 掩码估计装置、掩码估计方法以及记录介质-201680081856.3
  • 伊藤信贵;荒木章子;中谷智广 - 日本电信电话株式会社
  • 2016-12-20 - 2023-06-02 - G10L21/0272
  • 掩码估计装置(10)的特征提取部(11)从将多个音频信号在不同位置观测的多个观测信号,提取将观测信号的时间频率成分按照每个时间频率点汇集的特征量向量。掩码更新部(12)根据特征量向量、将特征量向量的概率分布通过由多个元素分布构成的混合分布进行模型化时的各元素分布的混合权重、作为可以控制各元素分布的形状的模型参数的形状参数,估计表示对于各时间频率点的各元素分布做出贡献的比例的掩码。混合权重更新部(13)根据被更新的掩码,更新混合权重。参数更新部(14)利用特征量向量和掩码,更新形状参数。
  • 音频源参数化-201780028437.8
  • 王珺 - 杜比实验室特许公司
  • 2017-04-05 - 2023-05-05 - G10L21/0272
  • 本发明描述一种用于从混合音频信号(102)估计音频源(101)的源参数的方法(600)。所述混合音频信号(102)包括多个帧。所述混合音频信号(102)可表示为频域中的混合音频矩阵且所述音频源(101)可表示为所述频域中的源矩阵。所述方法(600)包括基于混合矩阵(225)更新(601)非混合矩阵(221),所述非混合矩阵(221)经配置以提供从所述混合音频矩阵对所述源矩阵的估计,所述混合矩阵(225)经配置以提供从所述源矩阵对所述混合音频矩阵的估计。此外,所述方法(600)包括基于所述非混合矩阵(221)且基于所述混合音频信号(102)更新(602)所述混合矩阵(225)。另外,所述方法(600)包括迭代(603)所述更新步骤(601、602)直到满足整体收敛准则。
  • 空间可识别子带音频源的检测和提取方法、装置以及系统-202180041824.1
  • A·S·马斯特;芦烈;H·穆特 - 杜比实验室特许公司;杜比国际公司
  • 2021-06-11 - 2023-02-24 - G10L21/0272
  • 在实施例中,一种方法包括:将双声道时域音频信号的一个或多个帧变换成包括多个时频片的时频域表示,其中时频域表示的频域包括多个频率仓,该多个频率仓被分组成子带。针对每个时频片,该方法包括:计算时频片的空间参数和电平;使用移位参数和挤压参数修改空间参数;使用经修改的空间参数、电平、以及子带信息获得用于每个频率仓的软掩码值;以及将软掩码值应用于时频片以生成所估计的音频源的经修改的时频片。在实施例中,时频片的多个帧被组装成多个组块,其中,每个组块包括多个子带,并且上述方法针对每个组块中的每个子带执行。
  • 使用最少的训练分离一般化立体声背景与平移源-202180041971.9
  • A·S·马斯特 - 杜比实验室特许公司
  • 2021-06-11 - 2023-02-03 - G10L21/0272
  • 在实施例中,通过以下方式创建空间电平滤波器(SLF):从频域中的子频带中的多个目标源电平分布和空间分布获得第一样本集;从频域中的子频带中的多个背景电平分布和空间分布获得第二样本集;将第一样本集和第二样本集相加以创建组合样本集;针对每个子带,检测组合样本集中的每个样本的电平参数和空间参数;在子带内,通过目标源和背景的相应电平分布和空间分布对检测到的电平参数和空间参数进行加权;将组合样本集中的每个样本在子带内的加权后的电平参数、空间参数和信噪比(SNR)存储在表中;以及通过子带以及加权后的电平参数和空间参数对该表重新索引。
  • 音响处理方法、推定模型的训练方法、音响处理系统及程序-202180014435.X
  • 北村大地;渡边瑠伊 - 雅马哈株式会社
  • 2021-02-19 - 2022-09-30 - G10L21/0272
  • 音响处理系统具有取得部和生成部,该取得部取得输入数据,该输入数据包含:第1声音数据,其表示与第1音源对应的第1声音中的第1频带的第1成分;第2声音数据,其表示与不同于第1音源的第2音源对应的第2声音中的第1频带的第2成分;以及混合声音数据,其表示第1声音和第2声音的混合声音中的包含下述频带的成分的声音,该频带包含与第1频带不同的第2频带,该生成部将输入数据输入至训练好的推定模型,由此生成第1输出数据和第2输出数据中的至少一者,该第1输出数据表示第1声音中的包含第2频带的频带的成分,该第2输出数据表示第2声音中的包含第2频带的频带的成分。
  • 具有未知数量的多个说话者的话音分离-202080096429.9
  • L·沃尔夫;Y·M·阿迪;E·纳克玛尼 - 元平台公司
  • 2020-12-14 - 2022-09-23 - G10L21/0272
  • 在一个实施例中,一种方法包括:接收混合音频信号,该混合音频信号包括与多个说话者相关联的话音信号的混合;通过使用配置有第一数量的输出通道的第一机器学习模型处理混合音频信号来生成第一音频信号;基于第一音频信号来确定第一数量的输出通道中的至少一个输出通道是无声的;通过使用配置有第二数量的输出通道的第二机器学习模型处理混合音频信号来生成第二音频信号,第二数量的输出通道比第一数量的输出通道少;基于第二音频信号来确定第二数量的输出通道中的每个输出通道是非无声的;并且使用第二机器学习模型来分离与多个说话者相关联的附加混合音频信号。
  • 信号处理装置、方法和程序-202080022378.5
  • 高桥直也 - 索尼集团公司
  • 2020-03-13 - 2021-11-12 - G10L21/0272
  • 本技术涉及信号处理装置、方法和程序,该信号处理装置、方法和程序促进声源分离。该信号处理装置包括声源分离单元,该声源分离单元根据预先学习的预定声源分离模型对输入声学信号递归地执行声源分离以从包括预定声源的训练声学信号中分离预定声源。本技术适用于信号处理装置。
  • 用于语音分离的方法和系统-201980093781.4
  • 毕相如;张青山 - 哈曼国际工业有限公司
  • 2019-03-07 - 2021-10-26 - G10L21/0272
  • 本公开涉及一种使用滑动窗口的语音分离方法和系统。该方法包括:由至少一个传声器从至少一个用户获取至少一个语音并且将至少一个语音作为语音信号存储在声音记录模块中;通过滑动窗口从声音记录模块提取语音信号并且处理所提取语音信号;以及将所处理语音信号传输到DUET模块进行语音分离。
  • 基于退化分离估计技术的语音分离方法和系统-201980092422.7
  • 谢由页;毕相如;张青山;张国霞 - 哈曼国际工业有限公司
  • 2019-02-26 - 2021-09-24 - G10L21/0272
  • 公开了基于DUET算法的语音分离方法和系统。所述方法包括:接收来自传声器的信号;对接收的信号进行傅立叶变换(S110);计算每个数据点的相对衰减参数和相对延迟参数(S120);基于传声器之间的距离和传声器的采样频率选择相对延迟参数的聚类范围;将相对延迟参数的聚类范围内的数据点聚类成子集(S130);以及对每个子集进行逆傅立叶变换(S140)。它提供一种高效且智能的解决方案来在软件和/或硬件上部署DUET。
  • 信号处理装置和方法-201580082262.X
  • 米洛斯·马尔科维奇;卡里姆·赫尔旺尼;赫伯特·毕希纳;西蒙·高迪斯 - 华为技术有限公司;剑桥大学
  • 2015-12-21 - 2021-06-29 - G10L21/0272
  • 本发明涉及一种用于分离多个来自MIMO系统的混合信号(201)以迭代地获得多个输出信号(203)的信号处理装置(200)。所述多个混合信号(201)为所述MIMO系统对多个源信号的响应。所述信号处理装置(200)包括:多个盲源分离器(205A–N),包括基于第一盲源分离技术的第一盲源分离器(205A)和基于第二盲源分离技术的第二盲源分离器(205N),其中所述第一盲源分离器(205A)用于根据描述所述MIMO系统的第一系数集合计算第一多个初步输出信号(202A),所述第二盲源分离器(205N)用于根据描述所述MIMO系统的第二系数集合计算第二多个初步输出信号(202N);合路器(207),用于基于合路器系数集合将所述第一多个初步输出信号(202A)与所述第二多个初步输出信号(202N)进行合并,以获得所述多个输出信号(203),其中每个合路器系数与所述多个盲源分离器(205A–N)中的盲源分离器相关联;调节器(209),用于基于所述多个输出信号(203)调整所述第一盲源分离器(205A)的第一系数集合和所述第二盲源分离器(205N)的第二系数集合。
  • 用于转换输入音频信号的音频信号处理系统及方法-201980025148.1
  • J·勒鲁克斯;J·R·赫尔歇;王中秋;G·P·维歇恩 - 三菱电机株式会社
  • 2019-03-07 - 2020-11-17 - G10L21/0272
  • 关于用于转换输入音频信号的音频信号处理系统的系统和方法。处理器通过以下来实现模块的步骤:将输入音频信号输入到频谱图估计器中以提取音频特征序列,并对所述音频特征序列进行处理,以输出估计频谱图集合。使用频谱图细化模块处理所述估计频谱图集合和所述音频特征序列,以输出细化频谱图集合。其中所述频谱图细化模块的所述处理基于迭代重构算法。使用信号细化模块处理一个或多个目标音频信号的细化频谱图集合,以获得目标音频信号估计。输出接口输出优化的目标音频信号估计。其中通过使用存储在存储器中的优化器使误差最小化来优化所述模块。
  • 信号处理系统和方法-201480052202.9
  • N·斯特因;J·特拉;D·温格特 - 美国亚德诺半导体公司
  • 2014-09-24 - 2019-10-18 - G10L21/0272
  • 处理在用户设备处获取的声信号的方法包括从一组紧密间隔的麦克风获取并行信号以及使用多层计算方法中的一者或两者,在多层计算方法中一些处理在用户设备处执行,另外的处理在与用户设备进行数据通信的一个或多个服务器计算机中执行。利用能量内容以及到达方向的时间相对频率估计来处理所获取的信号。在一些实施例中,使用非负矩阵或张量因子分解方法来确定多个源,每个源均与来自该源的信号的对应到达方向相关联。在一些实施例中,表征到达方向信息的数据从用户设备传送到服务器计算机,在服务器计算机中执行基于方向的处理。
  • 用于自动语音识别(ASR)的自适应的基于相位差的噪声消减-201380078945.9
  • L·库里洛;G·斯特摩尔 - 英特尔公司
  • 2013-09-17 - 2019-08-27 - G10L21/0272
  • 本文总体描述了用于使基于相位差的降噪系统自适应的系统和方法的实施例。在一些实施例中,确定与第一和第二音频信号相关联的空间信息,其中,第一和第二音频信号包括波束内部的目标音频和来自波束外部的噪声。估计与音频信号相关联的信噪比(SNR)。使相位差到增益因子的映射自适应以便确定用于衰减与波束外部的噪声相关联的频率元的衰减因子。执行频谱相减,以便基于较少地影响与目标信号相关联的频率的权重来从单信道信号中去除估计的噪声。应用依赖于频率的衰减因子以衰减波束外部的频率元,从而产生具有减小的噪声的目标信号。
  • 声源分离方法、装置、及存储介质-201380068560.4
  • 本多宁;后藤晃;村山好孝 - 共荣工程株式会社
  • 2013-01-25 - 2019-04-26 - G10L21/0272
  • 本发明提供一种声源分离方法、装置、及存储介质,能够使用接近配置的传声器,将从任意方向传来的声音无需进行特别的分析便以少的运算量强调或压制后输出。对从传声器输入的一对输入信号的其中一个实施包含指定时间的延迟的滤波处理。而且,在滤波处理之后,利用交换电路对每一样本交替地更换一对输入信号,由此,生成一对交换信号,利用系数更新电路,对交换信号的一个乘以系数之后,生成交换信号的误差信号,运算包含误差信号的系数的递推公式,而对每一样本更新系数。然后,对一对输入信号乘以逐次被更新的系数并输出。
  • 多维虚拟学习系统和方法-201480047214.2
  • G·W·格莱姆 - 格莱姆会议有限责任公司
  • 2014-08-15 - 2017-09-05 - G10L21/0272
  • 一种用于生成三维声音会议的过程和系统,包括生成具有多个位置的虚拟地图,每个参与者选择所述位置之一,确定从每个位置到所述地图上的每个其它位置的方向,确定从每个位置到所述地图上的每个其它位置的距离,接收来自每个参与者的声音,对所接收的声音进行混音,将混音后的声音变换为双耳音频,以及经由与发言的参与者的虚拟位置相关联的扬声器将所述双耳音频声音定向到每个参与者。结果是清楚的声音,所述清楚的声音给聆听的参与者带来发言的参与者相对于聆听的参与者而位于何处的感觉。
  • 分离用数据处理装置以及程序-201480014346.5
  • 木村繁树 - 雅马哈株式会社
  • 2014-03-12 - 2015-12-02 - G10L21/0272
  • 存储装置(144)对在强调或者压抑音频信号(SA)的特定成分的分离处理中使用的分离用数据(Q)进行存储。更新用数据取得部(44)从多个终端装置(12)分别经由通信网(16)取得反映有由在使用了分离用数据(Q)的分离处理后的音频信号(SB)的播放音的收听者进行的输入的更新用数据(U)。更新处理部(46)利用更新用数据取得部(44)取得的各更新用数据(U),对存储装置(144)的分离用数据(Q)进行更新。
  • 信号源分离-201480008245.7
  • D·温格特;N·斯特因 - 美国亚德诺半导体公司
  • 2014-02-13 - 2015-10-21 - G10L21/0272
  • 具有紧密间隔元件的传声器用于获取多个信号,从其分离来自希望源的信号。该信号分离方法使用到达方向的信息或从获取信号之间诸如相位、延迟和振幅的变化确定的其他信息,以及关注源的信号和/或干扰信号的结构信息的组合。和常规的波束形成方法的有效性相比,通过这个信息组合,所述元件可以被更紧密间隔。在一些示例中,所有的传声器元件被集成到单个微电机械系统(MEMS)。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top