专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果5532个,建议您升级VIP下载更多相关专利
  • [发明专利]说话人识别方法、相关设备及可读存储介质-CN202010986890.3有效
  • 石周;高天 - 科大讯飞股份有限公司
  • 2020-09-18 - 2023-01-17 - G10L17/00
  • 本申请公开了一种说话人识别方法、相关设备及可读存储介质,上述方案中,可以获取说话人的人脸图像和说话人的语音信号;然后,基于说话人的人脸图像,生成说话人的人脸身份特征;最后,基于说话人的语音信号,和,说话人的人脸身份特征,生成说话人的识别结果。由于说话人的人脸身份特征能够反映说话人的身份信息,在说话人的语音信号无法准确反映说话人的身份信息时,说话人的人脸身份特征能够补充说话人的身份信息,因此,同时基于说话人的语音信号,和,说话人的人脸身份特征对说话人进行识别,相对于仅基于说话人的语音信号对说话人识别,识别结果更为准确。
  • 说话识别方法相关设备可读存储介质
  • [发明专利]基于模型顺序自适应技术的说话人确认系统创建方法-CN201310139096.5有效
  • 王军;王东;邬晓钧;郑方 - 清华大学
  • 2013-04-19 - 2013-07-31 - G10L17/00
  • 本发明公开了一种基于模型顺序自适应技术的说话人确认系统创建方法,包括步骤:依次录入第1至n个说话人的语音,其中,j依次取1到n执行如下步骤:录入第j个说话人的语音时,创建第j个说话人的通用背景模型、弱说话人模型,且对已建立的各个说话人的弱说话人模型进行更新。当第n个说话人的语音录入完毕后,第n个说话人的通用背景模型,及第1个至第n个说话人的弱说话人模型分别最后更新得到的说话人模型构成说话人确认系统。本发明基于初始通用背景模型,利用依次录入的n个说话人语音中包含的信道信息和说话人充分统计信息,顺序自适应出相应说话人的通用背景模型和说话人模型,从而创建出用于说话人身份确认的说话人确认系统。
  • 基于模型顺序自适应技术说话确认系统创建方法
  • [发明专利]一种语音处理方法、介质及系统-CN202010025486.X在审
  • 胡伟湘;王亚如;李伟;芦宇 - 华为技术有限公司
  • 2020-01-10 - 2021-07-16 - G10L17/02
  • 本申请涉及一种语音处理方法,包括:接收多个语音输入并从多个语音输入中提取多个语音特征;基于多个语音特征确定多个说话人特征;将多个说话人特征聚类为至少一个说话人特征类别,其中,至少一个说话人特征类别与至少一个说话人一一对应,并且至少一个说话人特征类别中的每个说话人特征类别包括多个说话人特征中的至少一个说话人特征;基于至少一个说话人特征类别,确定至少一个说话人模板,其中,至少一个说话人模板与至少一个说话人一一对应;和接收来自当前说话人的当前语音输入,并且基于当前语音输入和至少一个说话人模板,确定当前说话人是否与至少一个说话人中的一个说话人匹配。本申请可实现无感注册,避免了注册给说话人带来的负体验。
  • 一种语音处理方法介质系统
  • [发明专利]语音合成字典生成装置和语音合成字典生成方法-CN201510058451.5无效
  • 森田真弘 - 株式会社东芝
  • 2015-02-04 - 2015-08-12 - G10L13/06
  • 根据一个实施例,语音合成字典生成装置包括分析器、说话人自适应器、水平指定单元和确定单元。分析器被配置为分析语音数据,并生成包含对象说话人的话语特征的语音数据库。说话人自适应器被配置为通过基于数据库而将基本模型转换成更接近对象说话人的特征的说话人自适应来生成对象说话人的模型。水平指定单元被配置为接受表示说话人的话语技巧和/或说话人在语音合成字典的语言方面的母语水平的目标说话人水平的指定。确定单元被配置为根据目标说话人水平与对象说话人的说话人水平之间的关系,确定与在说话人自适应中的说话人特性再现的保真度有关的参数。
  • 语音合成字典生成装置方法
  • [发明专利]语音翻译装置、语音翻译方法以及记录介质-CN202010185150.X在审
  • 古川博基;坂口敦;西川刚树 - 松下电器产业株式会社
  • 2020-03-17 - 2020-10-02 - G10L15/00
  • 语音翻译装置(1)对第1说话者与第2说话者的会话进行翻译,第1说话者以第1语言说话,第2说话者以与第1语言不同的第2语言说话,具备:语音检测部(22),从输入到语音输入部(21)的声音中,检测第1及第2说话者发出的语音区间;显示部(27),通过由语音检测部检测到的语音区间的语音被语音识别,显示该语音所示的第1语言向第2语言的翻译结果,并且显示从第2语言向第1语言的翻译结果;说话指示部(25),在第1说话说话后,将催促第2说话说话的内容经由显示部以第2语言输出,并且在第2说话说话后,将用于催促第1说话说话的内容经由显示部以第1语言输出。
  • 语音翻译装置方法以及记录介质
  • [发明专利]说话人识别方法和说话人识别设备-CN201610216660.2在审
  • 石自强;刘柳;刘汝杰 - 富士通株式会社
  • 2016-04-07 - 2017-10-20 - G10L17/02
  • 本发明公开了一种说话人识别方法和说话人识别设备。该说话人识别方法包括从待识别说话人语料中,提取待识别说话人的语音特征;基于所提取的待识别说话人的语音特征、体现语音特征在特征空间中的分布的通用背景模型UBM、体现语音特征在特征空间中的分布的变化的统计值的梯度通用说话人模型GUSM、体现环境变化的总变化矩阵,得到待识别说话人模型;以及比较待识别说话人模型和已知说话人模型,以确定待识别说话人是否为已知说话人之一。
  • 说话识别方法设备
  • [发明专利]音频的说话人识别方法及装置-CN202111574887.1在审
  • 何淑琳 - 顺丰科技有限公司
  • 2021-12-21 - 2023-06-23 - G10L17/06
  • 本申请提供一种音频的说话人识别方法及装置,该音频的说话人识别方法包括:获取待识别音频中多个第一音频帧的声音特征和多个预设说话人声音特征;根据多个第一音频帧的声音特征和多个预设说话人声音特征确定各个第一音频帧的第一说话人识别结果;对多个第一音频帧的第一说话人识别结果平滑处理,得到第二说话人识别结果;根据第二说话人识别结果更新预设说话人声音特征并再次进行说话人识别,得到目标说话人识别结果。本申请能够得到更为准确的说话人识别结果,从而提高音频的说话人识别方法准确度。
  • 音频说话识别方法装置
  • [发明专利]说话人识别方法、设备和系统-CN200910086980.0有效
  • 杨玮玮;祝宁 - 华为技术有限公司
  • 2009-06-12 - 2010-12-22 - G10L15/00
  • 本发明实施例涉及一种说话人识别方法、设备和系统,其中该说话人识别方法包括:接收媒体网关控制器发送的说话人确认指示;根据所述说话人确认指示执行说话人确认操作,并获取说话人确认操作的结果;将所述说话人确认操作的结果上报至所述媒体网关控制器本发明实施例媒体网关根据媒体网关控制器发送的说话人确认指示进行说话人确认操作,然后将说话人确认操作的结果上报至媒体网关控制器,实现了在分离架构下通过媒体网关控制协议进行说话人识别。
  • 说话识别方法设备系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top