[发明专利]特征向量补偿装置和特征向量补偿方法无效

申请号：	200710088572.X	申请日：	2007-03-16
公开（公告）号：	CN101051461A	公开（公告）日：	2007-10-10
发明（设计）人：	赤岭政巳;益子贵史;丹尼尔·巴雷达;雷姆科·特尤南	申请（专利权）人：	株式会社东芝
主分类号：	G10L15/20	分类号：	G10L15/20
代理公司：	中国国际贸易促进委员会专利商标事务所	代理人：	曲瑞
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种特征向量补偿装置和特征向量补偿方法。其中，特征提取单元提取输入语音的特征向量。相似性计算单元根据特征向量，针对多个噪声环境中的每一个计算相似度。补偿向量计算单元从存储单元中获取第一补偿向量，根据第一补偿向量计算第二补偿向量，并且通过以相似度作为加权系数使第二补偿向量加权相加，来计算第三补偿向量。补偿单元根据第三补偿向量来补偿特征向量。
搜索关键词：	特征向量补偿装置方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种特征向量补偿装置，用于补偿在背景噪声环境下的语音处理中使用的语音的特征向量，包括：存储单元，针对多个噪声环境中的每一个，在其中存储第一补偿向量；特征提取单元，提取输入语音的特征向量；相似性计算单元，根据所提取的特征向量，针对每个噪声环境计算相似度，所述相似度表示输入语音在所述噪声环境下产生的确定性；补偿向量计算单元，从所述存储单元中获取第一补偿向量，根据所获取的第一补偿向量，计算作为针对每个噪声环境的特征向量的补偿向量的第二补偿向量，并且通过以相似度作为加权系数使计算出的第二补偿向量加权相加，来计算第三补偿向量；和补偿单元，根据第三补偿向量来补偿所提取的特征向量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于株式会社东芝，未经株式会社东芝许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200710088572.X/，转载请声明来源钻瓜专利网。

同类专利

呼叫通话的语义识别方法、设备及存储介质-202311211350.8
发明人：谢国斌;徐约可;马明;刘昆 -专利权人：深圳大道云科技有限公司
申请日： 2023-09-20 - 公布日： 2023-10-27 - 主分类号： G10L15/20
摘要：本发明涉及语音控制领域，公开了一种呼叫通话的语义识别方法、设备及存储介质。该方法包括：根据预处理分析，对语音数据降噪切割处理，生成降噪音频片段集；根据语音分析算法，对降噪音频片段集进行语义识别处理，生成预测结果集；根据情感分析算法，对降噪音频片段集进行情感识别处理，生成情感标签集；根据声纹分析算法，对降噪音频片段集进行声纹识别处理，生成声纹标签集；对预测结果集进行打标处理，生成标记结果集；对标记结果集进行分类组合处理，生成组合结果集；根据文本分析算法，对组合结果集进行筛选处理，得到目标识别结果。在本发明实施例中，解决了当前的呼叫通话语音的无法有效准确的识别来源和内容的技术问题。

噪声识别方法、装置、设备及计算机存储介质-202210377727.6
发明人：孟先艳;牛保林;许天祥;赵美超;赵江江 -专利权人：中移在线服务有限公司;中国移动通信集团有限公司
申请日： 2022-04-12 - 公布日： 2023-10-27 - 主分类号： G10L15/20
摘要：本申请实施例提供了一种噪声识别方法、装置、设备及计算机存储介质，该噪声识别方法包括获取待识别的语音数据，语音数据包括语素数据和转文本数据；对语素数据的第一特征值和转文本数据的第二特征值进行向量转换，分别得到语素数据和转文本数据中表征词层面的目标预设维度的第一特征向量；通过预设的意图模型提取转文本数据中表示语义的目标预设维度的第二特征向量；基于预设的意图模型计算转文本数据与每个预设意图的注意力得分，注意力得分表示转文本数据的类别特征；通过二分类深度神经网络模型，对第一特征向量、第二特征向量和类别特征进行二分类处理，得到待识别的语音数据的噪声识别结果。根据本申请实施例，能提高识别准确率和用户体验。

语音唤醒智能控制方法、装置、电子设备及存储介质-202110328123.8
发明人：何海亮 -专利权人：深圳市欧瑞博科技股份有限公司
申请日： 2021-03-26 - 公布日： 2023-10-27 - 主分类号： G10L15/20
摘要：本申请公开了一种语音唤醒智能控制方法、装置、电子设备及计算机可读存储介质。该方法应用于智能设备，该方法通过识别待抑制处理的语音信号，并对语音信号的初始置信度进行抑制处理，根据抑制置信度与预设置信度阈值判断是否执行对智能设备的唤醒操作。通过对待抑制处理的语音信号的置信度进行抑制处理，针对性地降低待抑制处理的语音信号的唤醒概率，从而降低智能设备的误唤醒率。

确定电子设备的方法、装置、存储介质及电子装置-202110742317.2
发明人：刘建国;栾天祥;赵培 -专利权人：青岛海尔科技有限公司;海尔智家股份有限公司
申请日： 2021-06-30 - 公布日： 2023-10-24 - 主分类号： G10L15/20
摘要：本发明公开了一种确定电子设备的方法、装置、存储介质及电子装置。其中，该方法包括：获取多个电子设备所采集的语音信号，每个电子设备包括至少一个麦克风阵列；基于每个电子设备所采集的语音信号，确定每个电子设备所采集的语音信号对应的混响能量占比，其中，混响能量占比表征电子设备所采集的语音信号中，混响能量分量与直达能量分量的关系；根据多个电子设备的混响能量占比，从多个电子设备中确定目标设备。本发明解决了现有技术中由于分布式唤醒方法通过去混响、降噪的方式来抑制环境影响对距离估计的影响造成分布式唤醒方法运算量大、性能差和实际应用价值小的技术问题。

电子设备及其操作方法-201911065435.3
发明人：高炫睦 -专利权人：三星电子株式会社
申请日： 2019-11-04 - 公布日： 2023-10-24 - 主分类号： G10L15/20
摘要：通过获得电子设备或电子设备的用户的情境信息来提供对用户的语音或话语的响应，基于情境信息来确定电子设备还是外部设备将对用户的语音或话语执行自动语音识别(ASR)，并且基于执行ASR的电子设备或外部设备的结果提供对用户的语音或话语的响应。

语音识别方法、装置、电子设备及计算机可读存储介质-202010185078.0
发明人：欧阳能钧;许峻华;宋政斌;杨丹青;徐刚 -专利权人：阿波罗智联（北京）科技有限公司
申请日： 2020-03-17 - 公布日： 2023-10-24 - 主分类号： G10L15/20
摘要：本申请公开了一种语音识别方法、装置、电子设备及计算机可读存储介质，涉及语音识别技术领域。具体实现方案为：根据预设时间段内的第一麦克风信号和第一参考信号进行时延估计，得到时延值；获取系统音频信号，并利用所述时延值对所述系统音频信号进行处理，得到第二参考信号；根据所述第二参考信号对采集的第二麦克风信号进行消噪处理，得到待识别语音信号；对所述待识别语音信号进行识别。根据本申请中方案，可以增强语音识别效果。

一种语音识别方法、装置、设备和介质-202010476393.9
发明人：杨丹青;宋政斌;徐刚 -专利权人：阿波罗智联（北京）科技有限公司
申请日： 2020-05-29 - 公布日： 2023-10-20 - 主分类号： G10L15/20
摘要：本申请实施例公开了一种语音识别方法、装置、设备和介质，涉及人工智能语音识别技术领域。具体实现方案为：获取至少两个音区的麦克风所采集的音频信号；根据各所述音频信号的声音能量，确定各音频信号包括关键语音的状态；根据各音频信号包括关键语音的状态，分别调整各音区的自适应滤波器的自适应调整参数；控制各自适应滤波器根据各自的所述自适应调整参数，对所对应音区的音频信号进行自适应滤波处理，并输出滤波后信号；根据各滤波后信号，进行语音识别。本申请实施例在复杂发声场景下，提高了语音识别的准确度和全面性。

语音指令识别方法、设备及可读存储介质-202310815659.1
发明人：邵有明;王驰江;丁华;封宇 -专利权人：深圳市汉星电子有限公司
申请日： 2023-07-04 - 公布日： 2023-10-13 - 主分类号： G10L15/20
摘要：本申请公开了一种语音指令识别方法、设备及可读存储介质，属于语音识别技术领域。本申请通过在当前采集的音频信号的信号幅值大于第一阈值时，以当前时刻为基准点，基于预设步长截取初始指令信号；获取所述初始指令信号对应的区间之前的相邻区间对应的基础音频信号，所述相邻区间的区间长度为预设值；确定所述采集设备对应的位置信息以及所述基准点对应的世界时间；基于所述位置信息和所述世界时间确定滤波模型；根据所述滤波模型以及所述基础音频信号，对所述初始指令信号做噪声滤除；基于滤除噪声后的所述初始指令信号，识别语音指令。实现了在非平稳噪声环境中准确识别语音指令的有益效果。

多人位语音沙发就近控制方法-202310890374.4
发明人：王想;刘鑫尧 -专利权人：苏州智为微电子有限公司
申请日： 2023-07-20 - 公布日： 2023-10-10 - 主分类号： G10L15/20
摘要：多人位语音沙发就近控制方法,属于语音沙发控制技术领域.本发明语音就近控制机制方法采用多人位语音沙发的每一个沙发位的语音控制器接收到语音命令时会评估自己接收到的语音命令信号质量，通过判定语音命令信号质量的大小估算出用户到手控器的距离，并通过无线模块将语音命令信号质量信息发送出去，同时接收其他沙发位发出的语音命令质量信息综合对比后确认当前自己是否离用户最近。如果当前控制器离用户最近则响应用户语音命令，否则进入静默状态不再响应语音指令，音命令信号质量和用户到语音控制器之间的距离正相关，用户使用多人位语音沙发说出命令词时只有离用户最近的沙发位的语音控制器会响应用户命令，彻底解决不同沙发位相互干扰的问题。

语音识别方法、装置、车辆及存储介质-202210316591.8
发明人：贺永强;胡含;陈伟;李洋;苏皓然;池军;郝超;王涛 -专利权人：北京罗克维尔斯科技有限公司
申请日： 2022-03-28 - 公布日： 2023-10-10 - 主分类号： G10L15/20
摘要：本公开涉及一种语音识别方法、装置、车辆及存储介质。本公开实施例，通过获取目标车辆的座舱内的各个麦克风采集的语音信号，语音信号包括麦克风采集到语音信号的时间和语音信号的强度信息；基于各个麦克风采集到语音信号的时间和强度信息，确定语音信号的来源位置是否位于座舱内部，若来源位置位于座舱内部，则响应语音信号，进行语音识别，可以在满足正常的座舱内部用户语音交互的同时，避免与座舱外部的用户进行语音交互，提高了用户语音交互的安全性。

语音唤醒词的检测方法、装置、存储介质和电子设备-202310934138.8
发明人：王雄 -专利权人：腾讯科技（深圳）有限公司
申请日： 2023-07-28 - 公布日： 2023-10-10 - 主分类号： G10L15/20
摘要：本申请公开一种语音唤醒词的检测方法、装置、存储介质和电子设备，涉及语音唤醒技术领域，可应用于智慧交通领域，该方法中，获取带噪语音信号的频域特征，作为第一语音特征，针对第一语音特征进行迭代处理，一次迭代处理包括：针对基于第一语音特征获得的待降噪特征进行降噪处理，获得本次迭代对应的候选特征，再将最后一次迭代获得的候选特征作为目标特征，基于此获得目标降噪参数，对第一语音特征进行降噪处理，获得第二语音特征，再基于此进行语音唤醒词的检测，获得带噪语音信息的目标检测结果。基于该方法，能够有效保留带噪语音信号中的语音唤醒词，解决相关技术因损伤语音唤醒词导致后续检测不准确的问题。

一种语音处理方法、装置及电子设备-202210293916.5
发明人：唐吴全;孙峰;王斌 -专利权人：华为技术有限公司
申请日： 2022-03-24 - 公布日： 2023-10-03 - 主分类号： G10L15/20
摘要：本申请提供了一种语音处理方法、装置及电子设备。方法包括：获取第一音频信号；确定第一音频信号中包含有第一命令，并确定第一命令的第一起始时间；基于第一起始时间，从通过第一语音识别方式对第一音频信号进行转换得到的第一目标文本中确定出与第一起始时间对应的子文本；将子文本替换为第一命令对应的第一文本，以得到第二目标文本，第一文本具有第一标签，第一标签用于标识第一文本为命令；基于第二目标文本，输出第一命令。这样，在后续进行自然语言理解时，可以通过第二目标文本中所包含的第一文本的标签准确的理解出第二目标文本的语义，并识别出第二目标文本中所包含的命令和输出该命令。由此降低了语音识别过程中漏识别的概率。

模型确定方法、模型应用方法和相关装置-202310824944.X
发明人：冯鑫 -专利权人：腾讯科技（深圳）有限公司
申请日： 2023-07-06 - 公布日： 2023-10-03 - 主分类号： G10L15/20
摘要：本申请实施例公开了模型确定方法、模型应用方法和相关装置，在初始语音分离模型中包括用于分析发音对象数量的初始数量确定模块，和用于基于初始数量确定模块确定出发音对象数量进行语音分离的初始语音分离模块，只需输入样本语音信息，即可通过该模型分离得到语音分离结果。通过该样本语音信息所对应的准确语音分离结果与模型输出之间的差异，能够体现出该模型对发音对象数量分析的准确度和对语音信息分离的准确度，从而基于该差异对初始语音分离模型进行参数调节可以使模型同时学习到如何准确进行发音对象数量分析和语音信息准确分离，使得到的语音分离模型可以无需除待分离语音信息外的其他信息输入即可实现准确的语音分离，提高语音分离效率。

语音识别方法、设备和存储介质-202310680032.X
发明人：史莫晗;杜志浩;陈谦;俞帆;张仕良;李泱泽;张结;戴礼荣 -专利权人：阿里巴巴（中国）有限公司
申请日： 2023-06-08 - 公布日： 2023-09-29 - 主分类号： G10L15/20
摘要：本申请提供一种语音识别方法、设备和存储介质，方法包括：通过语音识别编码器获取语音信号对应的第一向量表示，通过说话者编码器获取语音信号对应的第二向量表示，通过文本编码器对语音识别解码器已经输出的前n‑1个字进行编码处理，得到第n‑1个字对应的第三向量表示。将第一向量表示、第二向量表示和第三向量表示输入说话者解码器中，获得第n个字对应的说话者向量表示，根据该说话者向量表示分别与多个说话者的画像特征向量之间的相关性系数，确定第n个字对应的说话者。将第一向量表示、前n‑1个字以及相关性系数对多个说话者的画像特征向量的加权和，输入语音识别解码器，获得第n个字，提高了各个字对应的说话者识别结果的准确性。

用于基于车辆的环境确定推荐的可靠性的装置和方法-201811423559.X
发明人：李京澈;朴晟秀 -专利权人：现代自动车株式会社;起亚自动车株式会社
申请日： 2018-11-26 - 公布日： 2023-09-26 - 主分类号： G10L15/20
摘要：一种用于基于车辆的环境确定推荐的可靠性的装置和方法，该装置可以包括：输入设备，配置为检测车辆中的声音；存储器，配置为存储与声音相关联的信息；输出设备，配置为输出与推荐动作相关联的信息；以及控制器，与输入设备、存储器以及输出设备电连接。控制器可以配置为：利用输入设备获得音频信息；基于音频信息和车辆的状态获得车辆的声学状态信息，声学状态信息与车辆的状态和包含在音频信息中的噪声相关联；当获得音频信息时确定车辆的情境信息；对音频信息执行语音识别以获得文本信息；针对与文本信息和情境信息对应的一个或多个动作计算推荐指数；以及基于声学状态信息和计算出的推荐指数生成对一个或多个动作中的至少一个动作的推荐。

自适应噪声环境的语音信号处理的方法和装置-201780088703.6
发明人：成昊相;郑钟勋;朱基岘;吴殷美 -专利权人：三星电子株式会社
申请日： 2017-03-22 - 公布日： 2023-09-26 - 主分类号： G10L15/20
摘要：根据本发明的一个实施例的用于解决技术问题的处理语音信号的方法，包括以下步骤：通过使用至少一个麦克风获取近端噪声信号和近端语音信号；根据呼入获取远端语音信号；基于关于所述近端语音信号的信息、关于所述近端噪声信号的信息以及关于远端语音信号的信息的至少一者来确定噪声控制参数和语音信号改变参数；基于所述噪声控制参数来生成所述近端噪声信号的反相信号；基于所述语音信号改变参数、所述近端噪声信号、所述反相信号和误差信号来改变所述远端语音信号，使得可以改进远端语音信号的清晰度；以及输出所述反相信号和改变后的远端语音信号。

一种语音数据处理方法及装置-202010157139.2
发明人：张银平;汪俊杰;杨琳;徐培来;王旭阳 -专利权人：联想（北京）有限公司
申请日： 2020-03-09 - 公布日： 2023-09-19 - 主分类号： G10L15/20
摘要：本申请提供一种语音数据处理方法及装置，获取监控区域在第一时间段的第一语音数据和第一时间段的第一视频数据，若第一视频数据指示监控区域没有处于讲话状态的目标对象，至少根据第一语音数据，得到监控区域中辅助降噪处理的声音数据，获取监控区域在第二时间段的第二语音数据和第二时间段的第二视频数据，若第二视频数据指示监控区域有处于讲话状态的目标对象，根据声音数据对第二语音数据进行降噪处理。因为声音数据是根据监控区域没有处于讲话状态的目标对象时的第一语音数据得到，所以通过声音数据能够体现监控区域的噪声水平，提高噪声水平估计的准确度，通过该声音数据对第二语音数据进行降噪处理时可提高降噪效果以及语音数据的识别结果。

基于自组织麦克风阵列的远场拾音语音识别方法及系统-202310577166.9
发明人：叶婷;黄扬帆;黄啟洪;甘平;粟嘉伟;冯璐峰 -专利权人：重庆大学
申请日： 2023-05-19 - 公布日： 2023-09-15 - 主分类号： G10L15/20
摘要：本发明涉及基于自组织麦克风阵列的远场拾音语音识别方法，属于语音识别技术领域。包括以下步骤：S1、建立一个点声源和一个包含M个麦克风的自组织麦克风阵列，通过自组织麦克风阵列收集语音信息；S2、对于不同通道的麦克风采集到的不同强度的语音信号，采用统一阈值大小的滤波器进行预处理；S3、采用自适应滤波与维纳滤波联合的改进型滤波方式进行滤波降噪和语音增强；S4、通过训练好的WeNet网络框架进行语音识别。本方案能提升远距离及复杂噪声背景下语音识别算法的识别准确率。

语音处理方法、装置、终端设备及存储介质-202310689788.0
发明人：刘宗栋 -专利权人：广州小鹏汽车科技有限公司
申请日： 2023-06-09 - 公布日： 2023-09-12 - 主分类号： G10L15/20
摘要：本申请公开了一种语音处理方法、装置、终端设备及存储介质，其语音处理方法包括：获取若干个声音分区各自对应的待处理语音信号；基于预设的清晰度评估模型对待处理语音信号进行清晰度评估，得到对应的评估结果；基于评估结果，确定目标声音分区。基于本申请方案，可以摆脱对参考语音信号的依赖，并且清晰度评估模型能够适应环境噪声和说话人身姿改变等因素对待处理语音信号造成的动态影响，在此基础上能够准确地确定目标声音分区，有效降低了音区泄露的情况发生。

声音增强收录的头部佩带装置-202310627833.X
发明人：周玉军;刘志 -专利权人：深圳黄鹂智能科技有限公司
申请日： 2023-05-31 - 公布日： 2023-09-08 - 主分类号： G10L15/20
摘要：本发明公开了一种声音增强收录的头部佩带装置，包括正面部分、侧面部分和信号合成模块。正面部分中设置有两个前向麦克风模块，用于收录用户自己的说话声和用户对面说话人的说话声，侧面部分分别设置两个侧向麦克风模块，用于收录环境噪声。信号合成模块对两个前向声音信号进行增强处理以获得增强的前向声音信号，并利用各前向声音信号和各侧向声音信号生成所述增强的前向声音信号在不同频段上的掩蔽阈值；利用该掩蔽阈值对所述增强的前向声音信号进行降噪处理，得到输出的语音信号。本发明能够有效地对用户自己和对面说话人的声音进行分离和降噪，提高声音的收录质量。

一种提高语音识别精度的降噪处理方法及系统-202310877968.1
发明人：黄泽源;张恒;付佳鑫 -专利权人：西兴（青岛）技术服务有限公司
申请日： 2023-07-18 - 公布日： 2023-09-08 - 主分类号： G10L15/20
摘要：本发明提供了一种提高语音识别精度的降噪处理方法及系统，涉及数据处理技术领域，通过根据两个位置数据的采集节点配置对齐认证窗口进行其一位置数据的特征提取，并基于特征提取结果的映射时间节点进行两个位置数据对齐，在对齐后基于噪声剔除获得噪声初始剔除数据；进一步通过获取噪声匹配结果执行噪声初始剔除数据的噪声剔除及增强混合后执行语音识别。解决了现有技术中存在进行语音降噪精度较低，导致降噪后语音中杂音过重或过度降噪导致语音内容缺失，影响后续基于降噪语音进行内容识别的识别精度的技术问题。达到了提高语音降噪精度，提高所获降噪后语音的完整度，为进行内容识别提供高保真语音记录的技术效果。

一种语音降噪处理方法、电子设备及存储介质-202310812459.0
发明人：高宝明;王志宇;孙国繁;高磊;蔡晓龙;张阳阳;张广勇 -专利权人：国网山西省电力公司超高压变电分公司
申请日： 2023-07-04 - 公布日： 2023-09-05 - 主分类号： G10L15/20
摘要：本申请实施例提供一种语音降噪处理方法、电子设备及存储介质，包括：S10，建立训练样本；所述训练样本中包括：弱噪声环境下的第一语音数据、以及强噪声环境下的第二语音数据；S20，对训练样本中的第一语音数据和第二语音数据进行融合，得到语音降噪训练数据；S30，对语音降噪训练数据进行分帧，获得多帧语音降噪训练数据单元；S40，通过第一语音数据、多帧语音降噪训练数据单元对生成式对抗网络模型进行训练，得到训练后的生成式对抗网络模型；S50，通过训练后的生成式对抗网络模型对待处理的语音识别数据进行降噪，获得目标语音识别数据；具有降噪效果较好的有益效果，适用于语音降噪的技术领域。

语音接口设备的噪声降低-201780058659.4
发明人：肯尼斯·米克斯特 -专利权人：谷歌有限责任公司
申请日： 2017-10-03 - 公布日： 2023-09-05 - 主分类号： G10L15/20
摘要：一种具有一个或多个麦克风和扬声器的电子设备的方法，该电子设备被配置为通过包括基于语音的可供性(affordance)的多个可供性中的任一唤醒，包括确定电子设备周围的环境的噪声分布；确定噪声分布是否干扰基于语音的可供性；并且根据噪声分布干扰基于语音的可供性的确定，向用户呈现提示以使用多个可供性中除基于语音的可供性之外的可供性来唤醒电子设备。

用于语音识别的方法和装置-201780094599.1
发明人：毕相如;张国霞 -专利权人：哈曼国际工业有限公司
申请日： 2017-09-28 - 公布日： 2023-09-05 - 主分类号： G10L15/20
摘要：提供了用于语音识别的方法和装置。所述语音识别方法包括：接收语音信息，所述语音信息是通过配置在连接在一起的多个装置上的多个语音采集装置来采集，其中所述多个装置包括至少一个移动装置；以及对通过所述多个语音采集装置采集到的所述语音信息实行语音分离与识别过程。所述语音识别装置包括：处理器，所述处理器被配置成：获得连接在一起的多个装置间的时钟差，其中所述多个装置中的每一者被配置成具有语音采集装置；获得语音信息，所述语音信息是通过配置在所述多个装置中的所述每一者上的所述语音采集装置来采集；以及基于所述多个装置间的所述时钟差，对通过所述语音采集装置采集到的语音信息实行语音分离与识别过程。

语音处理方法、装置、外设操控设备及电子设备-202010556316.4
发明人：王中一 -专利权人：北京百度网讯科技有限公司
申请日： 2020-06-17 - 公布日： 2023-08-29 - 主分类号： G10L15/20
摘要：本申请公开了一种语音处理方法、装置、外设操控设备及电子设备，涉及人工智能、深度学习、自然语言处理及语音交互技术领域。具体实现方案为：响应于获取的外设操控设备发送的语音识别接口调用请求，启动语音识别流程；获取外设操控设备的类型；根据外设操控设备的类型，确定目标语音降噪模式；根据目标语音降噪模式，对外设操控设备发送的语音数据进行降噪处理，以获取降噪后的语音数据；对降噪后的语音数据进行语音识别，以生成文本数据。由此，通过这种语音处理方法，降低了语音数据中包括的外设操控设备中的其他操作所产生的噪声水平，从而提升了语音数据的质量，以及语音数据的识别准确度。

语音识别信号预处理方法、装置、设备及计算机存储介质-202010349173.X
发明人：陈润泽;陈航;任永华;胡瑛;王振志 -专利权人：中国移动通信集团浙江有限公司;中国移动通信集团有限公司
申请日： 2020-04-28 - 公布日： 2023-08-15 - 主分类号： G10L15/20
摘要：本发明实施例涉及语音信号处理技术领域，公开了一种语音识别信号预处理方法，该方法包括：接收待识别语音信号，并提取待识别语音信号中各待识别语句的声纹特征，其中，待识别语音信号包括至少一个待识别语句；根据声纹模型库对各待识别语句的声纹特征进行识别，得到初始识别结果；其中，声纹模型库为根据待识别语音信号中当前待识别语句之前的各待识别语句进行短时注册构建得到；对待识别的语音信号的各待识别语句进行失真性分析，得到各待识别语句的失真度结果；根据失真度结果对声纹模型库及初始识别结果进行调整，得到目标声纹模型库及目标识别结果。通过上述方式，本发明实施例实现了语音识别的准确性的有益效果。

一种语音处理方法、装置及设备-202110867725.0
发明人：陈小强;蒲胤华 -专利权人：展讯半导体（成都）有限公司
申请日： 2021-07-28 - 公布日： 2023-08-11 - 主分类号： G10L15/20
摘要：本申请实施例提供一种语音处理方法、装置及设备，应用于语音系统，所述语音系统中包括麦克风和扬声器，该方法包括：获取所述麦克风在预设时段内采集的第一语音信号，所述第一语音信号包括用户语音信号和所述扬声器在所述预设时段内播放的语音信号；在缓存中获取所述预设时段内的第二语音信号；根据所述第一语音信号和所述第二语音信号，确定所述扬声器对所述缓存中的语音信号进行播放的时延；根据所述时延对所述第二语音信号进行校准处理，得到第三语音信号；根据所述第三语音信号对所述第一语音信号进行处理，以在所述第一语音信号中提取所述用户语音信号。提高了语音处理的准确性。

一种噪声识别模型的训练方法和装置-202310467856.9
发明人：崔午阳 -专利权人：京东科技信息技术有限公司
申请日： 2023-04-27 - 公布日： 2023-08-08 - 主分类号： G10L15/20
摘要：本发明公开了一种噪声识别模型的训练方法和装置，涉及大数据技术领域。该方法的一具体实施方式包括：根据交互场景划分规则，确定获取的音频片段所对应的交互场景；对于每个音频片段，根据音频片段的交互场景获取对应的打标规则，并根据打标规则对音频片段进行打标；对打标后的每个音频片段进行特征提取，以得到训练特征集；基于训练特征集进行模型训练，生成噪声识别模型，噪声识别模型用于对语音交互过程中生成的音频片段进行噪声识别。该实施方式通过划分交互场景，针对不同的交互场景的打标规则进行打标，以对噪声识别模型进行训练，能够提高打标的准确性，同时兼顾语音和噪声维度的识别效果，提高噪声识别模型的训练效果和识别准确率。

一种训练用于语音分组的分组模型的方法和语音降噪方法-202010225558.5
发明人：郭青丽;叶靖;胡瑜;李晓维 -专利权人：中国科学院计算技术研究所
申请日： 2020-03-26 - 公布日： 2023-08-08 - 主分类号： G10L15/20
摘要：本发明实施例提供了一种训练用于语音分组的分组模型的方法和语音降噪方法，该语音降噪方法包括：B1、获取输入音频，提取输入音频的分组特征；B2、将输入音频的分组特征输入分组模型，预测性地输出该输入音频的标签；B3、根据该输入音频的标签，将用该标签对应的组别的最优降噪策略处理后的音频得到的转录文本作为该输入音频的转录文本。本发明实施例的技术方案能够根据输入音频的对抗扰动的大小，预测其所属的组别，为其选择适于该组别的降噪策略进行降噪，可以降低转录的错误率，而且可以在保证在对抗转录恢复为原始转录的同时，不会影响干净样本的转录质量。

一种双模TWS蓝牙耳机的管理方法-202110336581.6
发明人：鲁鹏飞;鲁霖;姚放 -专利权人：深圳市芯中芯科技有限公司
申请日： 2021-03-29 - 公布日： 2023-08-04 - 主分类号： G10L15/20
摘要：本申请涉及一种双模TWS蓝牙耳机的管理方法，其包括用于确定耳机通讯模式的状态判断步骤、用于获取声源信息的信息获取步骤、用于将两只耳机声源信息集中的信息集中步骤、用于提取声源信息特征的特征提取步骤、用于将声源信息特征传送至手机的信号传输步骤、用于从声源信息特征中分析出所处环境模式的模式判断步骤、以及基于环境模式对声源信息进行处理以获取更精确的标准特征的信号处理步骤。本申请具有提高系统基于蓝牙耳机所获取声音信息的判断效率的效果。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]特征向量补偿装置和特征向量补偿方法无效

专利文献下载