“说话”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果5532个，建议您升级VIP下载更多相关专利

[发明专利]说话人识别方法、相关设备及可读存储介质-CN202010986890.3有效
发明人：石周;高天 -专利权人：科大讯飞股份有限公司
申请日： 2020-09-18 - 公布日： 2023-01-17 - 主分类号： G10L17/00 文献下载
摘要：本申请公开了一种说话人识别方法、相关设备及可读存储介质，上述方案中，可以获取说话人的人脸图像和说话人的语音信号；然后，基于说话人的人脸图像，生成说话人的人脸身份特征；最后，基于说话人的语音信号，和，说话人的人脸身份特征，生成说话人的识别结果。由于说话人的人脸身份特征能够反映说话人的身份信息，在说话人的语音信号无法准确反映说话人的身份信息时，说话人的人脸身份特征能够补充说话人的身份信息，因此，同时基于说话人的语音信号，和，说话人的人脸身份特征对说话人进行识别，相对于仅基于说话人的语音信号对说话人识别，识别结果更为准确。
说话识别方法相关设备可读存储介质

[发明专利]说话者预测方法、说话者预测装置以及通信系统-CN202111170526.0在审
发明人：鹈饲训史;田中良 -专利权人：雅马哈株式会社
申请日： 2021-10-08 - 公布日： 2022-04-26 - 主分类号： G10L19/04 文献下载
摘要：本发明提供了一种说话者预测方法、说话者预测装置以及通信系统。能够在当前的说话者正在说话的期间高精度地预测下一个要说话的说话者。说话者预测方法是用于获取多个说话者的语音并记录所述多个说话者的会话历史的说话者预测方法，该说话者预测方法获取语音，确定所获取的所述语音的说话者，基于所述确定的所述说话者和所述会话历史，从所述多个说话者中预测下一个要发声的说话者
说话预测方法装置以及通信系统

[发明专利]基于模型顺序自适应技术的说话人确认系统创建方法-CN201310139096.5有效
发明人：王军;王东;邬晓钧;郑方 -专利权人：清华大学
申请日： 2013-04-19 - 公布日： 2013-07-31 - 主分类号： G10L17/00 文献下载
摘要：本发明公开了一种基于模型顺序自适应技术的说话人确认系统创建方法，包括步骤：依次录入第1至n个说话人的语音，其中，j依次取1到n执行如下步骤：录入第j个说话人的语音时，创建第j个说话人的通用背景模型、弱说话人模型，且对已建立的各个说话人的弱说话人模型进行更新。当第n个说话人的语音录入完毕后，第n个说话人的通用背景模型，及第1个至第n个说话人的弱说话人模型分别最后更新得到的说话人模型构成说话人确认系统。本发明基于初始通用背景模型，利用依次录入的n个说话人语音中包含的信道信息和说话人充分统计信息，顺序自适应出相应说话人的通用背景模型和说话人模型，从而创建出用于说话人身份确认的说话人确认系统。
基于模型顺序自适应技术说话确认系统创建方法

[发明专利]基于事先知识的说话者检验及说话者识别系统和方法-CN01125917.5有效
发明人：罗兰德·库恩;奥利弗·史耶斯;帕特里克·安古因;吉恩－克劳德·君夸;罗伯特·博曼 -专利权人：松下电器产业株式会社
申请日： 2001-07-05 - 公布日： 2002-08-28 - 主分类号： G10L17/00 文献下载
摘要：客户说话者空间中的客户说话者位置被用于产生用于与测试的说话者数据或测试说话者语音模型比较的语音模型。该说话者空间能够利用训练说话者构成,训练说话者是从客户说话者人群、或从客户说话者、或从训练和客户说话者的混合整体地分离出来的。基于客户环境信息该说话者空间可重新估计以提高落在该说话者空间内的客户数据的似然性。在进入到说话者空间的该客户的登记期间,当满足预定条件时能够获得附加的客户语音。在该客户登记步骤该说话者分布同样能被使用。
基于事先知识说话检验识别系统方法

[发明专利]一种语音处理方法、介质及系统-CN202010025486.X在审
发明人：胡伟湘;王亚如;李伟;芦宇 -专利权人：华为技术有限公司
申请日： 2020-01-10 - 公布日： 2021-07-16 - 主分类号： G10L17/02 文献下载
摘要：本申请涉及一种语音处理方法，包括：接收多个语音输入并从多个语音输入中提取多个语音特征；基于多个语音特征确定多个说话人特征；将多个说话人特征聚类为至少一个说话人特征类别，其中，至少一个说话人特征类别与至少一个说话人一一对应，并且至少一个说话人特征类别中的每个说话人特征类别包括多个说话人特征中的至少一个说话人特征；基于至少一个说话人特征类别，确定至少一个说话人模板，其中，至少一个说话人模板与至少一个说话人一一对应；和接收来自当前说话人的当前语音输入，并且基于当前语音输入和至少一个说话人模板，确定当前说话人是否与至少一个说话人中的一个说话人匹配。本申请可实现无感注册，避免了注册给说话人带来的负体验。
一种语音处理方法介质系统

[发明专利]说话人声音的后台学习-CN02801598.3有效
发明人： C·S·黄;Y·C·楚;W·H·蔡;J·M·程 -专利权人：皇家菲利浦电子有限公司
申请日： 2002-04-25 - 公布日： 2003-12-17 - 主分类号： G01L17/00 文献下载
摘要：一个说话人识别系统，含有一个说话人模型生成器110用于产生大量的说话人模型。为此，该生成器在没有谁说出各自训练话语的说话人先验知识的情况下，在后台接收大量说话人的训练话语。为每一个群集训练一个对应的说话人模型。一个说话人识别器130识别说话人，对于从说话人接收的话语确定说话人模型中最可能的一个。认定与最可能的说话人模型关联的说话人为测试话语的说话人。
说话人声后台学习

[发明专利]语音处理的方法、装置、系统、设备和介质-CN201810995203.7在审
发明人：许云峰;刘刚;余涛;银鞍 -专利权人：阿里巴巴集团控股有限公司
申请日： 2018-08-29 - 公布日： 2020-03-10 - 主分类号： G10L21/0216 文献下载
摘要：一种语音处理的方法、装置、系统、设备和介质，包括：基于说话人的声纹特征在说话人注册表中，查询到所述说话人的标识，所述说话人的声纹特征是根据麦克风阵列采集说话人的语音信号获得的参数；在所述说话人注册表中所述说话人的标识对应的位置信息与所述说话人的位置信息不同，更新所述说话人注册表，所述说话人的位置信息是根据麦克风阵列采集说话人的语音信号获得的参数；在所述说话人的语音信号中标注所述说话人的标识，以跟踪所述说话人。
语音处理方法装置系统设备介质

[发明专利]语音合成字典生成装置和语音合成字典生成方法-CN201510058451.5无效
发明人：森田真弘 -专利权人：株式会社东芝
申请日： 2015-02-04 - 公布日： 2015-08-12 - 主分类号： G10L13/06 文献下载
摘要：根据一个实施例，语音合成字典生成装置包括分析器、说话人自适应器、水平指定单元和确定单元。分析器被配置为分析语音数据，并生成包含对象说话人的话语特征的语音数据库。说话人自适应器被配置为通过基于数据库而将基本模型转换成更接近对象说话人的特征的说话人自适应来生成对象说话人的模型。水平指定单元被配置为接受表示说话人的话语技巧和/或说话人在语音合成字典的语言方面的母语水平的目标说话人水平的指定。确定单元被配置为根据目标说话人水平与对象说话人的说话人水平之间的关系，确定与在说话人自适应中的说话人特性再现的保真度有关的参数。
语音合成字典生成装置方法

[发明专利]一种说话人语音分割方法、装置、电子设备和存储介质-CN202210225944.3在审
发明人：王明明;梁家恩 -专利权人：云知声智能科技股份有限公司
申请日： 2022-03-07 - 公布日： 2022-05-10 - 主分类号： G10L17/02 文献下载
摘要：本申请涉及一种说话人语音分割方法、装置、电子设备和存储介质，该方法包括：获取说话人语音；识别说话人语音得到说话人语音对应的文本；根据说话人语音对应的文本对说话人语音进行断句得到多个语音片段；提取多个语音片段对应的说话人声纹信息；根据说话人声纹信息对所述多个语音片段进行聚类得到每个说话人的语音。本申请通过语音识别引擎识别说话人语音得到说话人语音对应的文本，标点预测模型根据说话人语音对应的文本对说话人语音进行断句得到多个语音片段，提取多个语音片段中不同说话人的声纹信息，凝聚层次聚类算法将相同声纹信息的语音片段进行聚类得到每个说话人的语音
一种说话人语音分方法装置电子设备存储介质

[发明专利]语音翻译装置、语音翻译方法以及记录介质-CN202010185150.X在审
发明人：古川博基;坂口敦;西川刚树 -专利权人：松下电器产业株式会社
申请日： 2020-03-17 - 公布日： 2020-10-02 - 主分类号： G10L15/00 文献下载
摘要：语音翻译装置(1)对第1说话者与第2说话者的会话进行翻译，第1说话者以第1语言说话，第2说话者以与第1语言不同的第2语言说话，具备：语音检测部(22)，从输入到语音输入部(21)的声音中，检测第1及第2说话者发出的语音区间；显示部(27)，通过由语音检测部检测到的语音区间的语音被语音识别，显示该语音所示的第1语言向第2语言的翻译结果，并且显示从第2语言向第1语言的翻译结果；说话指示部(25)，在第1说话者说话后，将催促第2说话者说话的内容经由显示部以第2语言输出，并且在第2说话者说话后，将用于催促第1说话者说话的内容经由显示部以第1语言输出。
语音翻译装置方法以及记录介质

[发明专利]说话人识别方法和说话人识别设备-CN201610216660.2在审
发明人：石自强;刘柳;刘汝杰 -专利权人：富士通株式会社
申请日： 2016-04-07 - 公布日： 2017-10-20 - 主分类号： G10L17/02 文献下载
摘要：本发明公开了一种说话人识别方法和说话人识别设备。该说话人识别方法包括从待识别说话人语料中，提取待识别说话人的语音特征；基于所提取的待识别说话人的语音特征、体现语音特征在特征空间中的分布的通用背景模型UBM、体现语音特征在特征空间中的分布的变化的统计值的梯度通用说话人模型GUSM、体现环境变化的总变化矩阵，得到待识别说话人模型；以及比较待识别说话人模型和已知说话人模型，以确定待识别说话人是否为已知说话人之一。
说话识别方法设备

[发明专利]一种基于多说话人条件下目标说话人语音提取方法-CN201910694870.6在审
发明人：张鹏远;林格平;李文洁;万辛;戚梦苑;沈亮;颜永红 -专利权人：中国科学院声学研究所;国家计算机网络与信息安全管理中心
申请日： 2019-07-30 - 公布日： 2021-02-05 - 主分类号： G10L15/02 文献下载
摘要：本发明属于目标语音提取和自适应技术领域，具体涉及一种基于多说话人条件下目标说话人语音提取方法，该方法具体包括：实时获取多个说话人混合的语音，提取多个说话人混合的语音的频谱；将锚语音输入到预先训练的说话人识别模型中，提取出目标说话人的特征向量；将获取的多个说话人混合的语音的频谱和目标说话人的特征向量输入至预先训练的目标说话人语音提取网络中，获取目标说话人的语音频谱；基于该目标说话人的语音频谱，获取目标说话人的语音
一种基于说话条件下目标人语提取方法

[发明专利]音频的说话人识别方法及装置-CN202111574887.1在审
发明人：何淑琳 -专利权人：顺丰科技有限公司
申请日： 2021-12-21 - 公布日： 2023-06-23 - 主分类号： G10L17/06 文献下载
摘要：本申请提供一种音频的说话人识别方法及装置，该音频的说话人识别方法包括：获取待识别音频中多个第一音频帧的声音特征和多个预设说话人声音特征；根据多个第一音频帧的声音特征和多个预设说话人声音特征确定各个第一音频帧的第一说话人识别结果；对多个第一音频帧的第一说话人识别结果平滑处理，得到第二说话人识别结果；根据第二说话人识别结果更新预设说话人声音特征并再次进行说话人识别，得到目标说话人识别结果。本申请能够得到更为准确的说话人识别结果，从而提高音频的说话人识别方法准确度。
音频说话识别方法装置

[发明专利]说话人识别方法、设备和系统-CN200910086980.0有效
发明人：杨玮玮;祝宁 -专利权人：华为技术有限公司
申请日： 2009-06-12 - 公布日： 2010-12-22 - 主分类号： G10L15/00 文献下载
摘要：本发明实施例涉及一种说话人识别方法、设备和系统，其中该说话人识别方法包括：接收媒体网关控制器发送的说话人确认指示；根据所述说话人确认指示执行说话人确认操作，并获取说话人确认操作的结果；将所述说话人确认操作的结果上报至所述媒体网关控制器本发明实施例媒体网关根据媒体网关控制器发送的说话人确认指示进行说话人确认操作，然后将说话人确认操作的结果上报至媒体网关控制器，实现了在分离架构下通过媒体网关控制协议进行说话人识别。
说话识别方法设备系统

[发明专利]说话人语音增强方法、电子设备和存储介质-CN202111571548.8在审
发明人：赵飞;黄厚军;项煦;钱彦旻 -专利权人：思必驰科技股份有限公司
申请日： 2021-12-21 - 公布日： 2022-03-29 - 主分类号： G10L21/0232 文献下载
摘要：本发明公开说话人语音增强方法和装置，其中，一种说话人语音增强方法，包括：从注册音频中提取说话人特征，对所述说话人特征进行第一处理得到处理后的说话人特征；对待增强的带噪语音进行第二处理得到处理后的带噪语音；将所述处理后的说话人特征和所述处理后的带噪语音拼接后输入至说话人语音增强模型中进行说话人语音增强。通过将处理后的说话人特征和处理后的带噪语音拼接后输入至说话人语音增强模型中进行说话人语音增强，从而可以实现将低纬度的说话人特征信息得到充分的使用，进一步地将说话人的语音进行增强。
说话人语增强方法电子设备存储介质

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
下一页»
尾页
共 5532 条