专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果3055603个,建议您升级VIP下载更多相关专利
  • [发明专利]音频数据处理方法、装置、计算机设备和存储介质-CN202210895424.3有效
  • 冯鑫 - 腾讯科技(深圳)有限公司
  • 2022-07-28 - 2022-11-04 - G10L25/30
  • 本申请涉及一种音频数据处理方法、装置、计算机设备、存储介质和计算机程序产品。该方法包括:将待处理音频数据划分,得到各个子音频;对各个子音频进行时域特征和频域特征提取,得到各个子音频对应的时域特征和频域特征;基于各个子音频对应的中间时域特征和中间频域特征进行特征交互,得到各个子音频对应的目标交互特征;基于目标时域特征、目标频域特征和目标交互特征进行语义特征提取,得到各个子音频对应的音频语义特征,基于音频语义特征进行音乐分类,得到各个子音频对应的音乐可能性;基于音乐可能性确定各个音乐片段的音乐语义特征;基于音乐语义特征进行音乐片段分类,得到同类音乐片段集。
  • 音频数据处理方法装置计算机设备存储介质
  • [发明专利]多风格音频合成方法、装置、设备及存储介质-CN202011385987.5在审
  • 梁爽;陈闽川;马骏;王少军 - 平安科技(深圳)有限公司
  • 2020-12-02 - 2021-03-26 - G10L13/02
  • 本发明涉及人工智能领域,公开了一种多风格音频合成方法、装置、设备及存储介质。该方法包括:获取待处理的文本数据和单风格的第一梅尔谱;将所述第一梅尔谱输入预置风格提取网络进行特征提取,得到第一风格特征;将所述文本数据输入预置梅尔谱生成网络中的编码器进行特征提取以及将提取到的第一文本特征与所述第一风格特征进行拼接,得到第一融合特征;将所述第一融合特征输入预置梅尔谱生成网络中的解码器进行特征转换,得到第二梅尔谱;将所述第二梅尔谱输入预置声码器进行音频生成,得到多风格音频。本发明利用风格特征作为声码器的条件特征,能够生成多风格的音频
  • 风格音频合成方法装置设备存储介质
  • [发明专利]说话人验证方法、装置以及存储介质-CN202210240088.9在审
  • 胡庆焱;王博;欧阳鹏 - 江苏清微智能科技有限公司
  • 2022-03-12 - 2022-08-02 - G10L17/02
  • 其中,说话人验证方法,用于实现移动端说话人的验证,包括:从预先设置的声音采集设备接收采集的说话人的音频数据,其中音频数据为用户的特定命令发声;将音频数据进行数据扩充,确定有效音频段;通过预先设置的特征提取算法,对有效音频段进行特征提取,确定音频特征;以及通过预先训练的声纹模型,将音频特征与预先注册用户的声音特征进行匹配,在音频特征与声音特征相匹配的情况下,确定说话人和用户为同一人,其中声纹模型为基于长短期记忆和全局平均信息融和技术的模型
  • 说话验证方法装置以及存储介质
  • [发明专利]图像生成方法以及相关设备-CN202210477320.0在审
  • 朱飞达;朱俊伟;储文青;邰颖;汪铖杰 - 腾讯科技(深圳)有限公司
  • 2022-05-04 - 2022-09-30 - G06V40/16
  • 本申请公开了一种图像生成方法以及相关设备,相关实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景;可以获取目标对象的原始面部图像帧和待生成的目标面部图像帧的音频驱动信息;对原始面部图像帧进行空间特征提取,得到原始面部空间特征;对音频驱动信息进行时序特征提取,得到面部局部姿态特征;基于原始面部空间特征和面部局部姿态特征对目标对象进行面部重建处理,生成目标面部图像帧。本申请可以通过对音频驱动信息进行特征提取,捕捉到目标对象部分的面部姿态细节信息,进而基于捕捉到的信息来对原始面部图像帧进行面部调整,从而获取音频驱动信息对应的目标面部图像帧,这样有利于提高目标面部图像帧的生成效率和准确性
  • 图像生成方法以及相关设备
  • [发明专利]搜索音频数据的方法和装置-CN201811100175.4有效
  • 黄安麒;刘彦彬;李深远;董治;代玥;范恒远;陈莉 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2018-09-20 - 2022-04-08 - G06F16/63
  • 本发明提供了一种搜索音频数据的方法和装置,属于互联网技术领域。将多个音频数据的相关联图像数据分别输入指定的特征提取模型,得到每个音频数据的相关联图像数据对应的特征信息,进行存储,其中,所述特征信息包括音频类型信息和图像特征信息;获取目标图像数据;将所述目标图像数据输入所述特征提取模型,得到所述目标图像数据对应的目标特征信息;确定所述目标特征信息分别与存储的每个音频数据对应的特征信息的相似度;基于每个音频数据对应的相似度,在所述多个音频数据中选取至少一个音频数据,作为所述目标图像数据对应的搜索结果采用本发明,可以提高搜索音频数据的灵活性。
  • 搜索音频数据方法装置
  • [发明专利]一种移动端虚拟形象实时语音驱动表情方法及装置-CN202211405039.2在审
  • 黄仰光 - 深圳市即构科技有限公司
  • 2022-11-10 - 2023-09-26 - G10L25/03
  • 本申请提出一种移动端虚拟形象实时语音驱动表情方法,包括S1:移动端采集用户的实时语音,并将实时语音组合形成音频数据包;S2:对音频数据包中的音频数据进行MFCC特征提取,将所述音频数据采用加窗和滑窗重组操作,得到特征提取后的音频数据;S3:检测音频数据是否是静音场景,若是,则返回步骤S1;若不是,则进行下一步骤;S4:将所述音频数据输入AI声音表情模型中,经过所述AI声音表情模型推理后,输出与用户嘴形相关的表情系数本申请的在特征提取时采用特征滑窗和重组机制,使模型的输出更加稳定,模型采用轻量化设计,满足移动端计算量需求。
  • 一种移动虚拟形象实时语音驱动表情方法装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top