专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果50个,建议您升级VIP下载更多相关专利
  • [发明专利]说话头视频合成方法、装置、电子设备及存储介质-CN202310764110.4在审
  • 丁万;黄东延;杨显杰;郑泽鸿;李鹏辉 - 深圳市优必选科技股份有限公司
  • 2023-06-26 - 2023-10-20 - G10L25/57
  • 本申请公开了一种说话头视频合成方法、说话头视频合成装置、电子设备及存储介质。该方法包括:获取待合成的语音数据及观测数据,所述观测数据为除语音数据之外的通过观测所得的数据;对所述语音数据进行特征提取,得到所述语音数据所对应的语音特征,以及,对所述观测数据进行特征提取,得到所述观测数据所对应的非语音特征;对所述语音特征及第一非语音特征进行时序建模,得到低维表征,其中,所述第一非语音特征为:对时序变化敏感的非语音特征;基于所述低维表征及第二非语音特征进行视频合成,得到说话头视频,其中,所述第二非语音特征为:对时序变化不敏感的非语音特征。通过本申请方案,可以降低说话头视频合成时的复杂度,减少合成耗时。
  • 话头视频合成方法装置电子设备存储介质
  • [发明专利]音视频处理方法、合成方法、装置、电子设备及存储介质-CN201910713206.1有效
  • 王胜 - 腾讯科技(深圳)有限公司
  • 2019-08-02 - 2023-10-20 - G10L25/57
  • 本发明公开了一种音视频处理方法、合成方法、装置、电子设备及存储介质,所述音视频处理方法包括:获取待处理音频数据,所述待处理音频数据是麦克风对扬声器输出的携带有第一特定音频数据的源音频数据进行采集生成的;确定所述待处理音频数据中第二特定音频数据的位置,所述第二特定音频数据为携带背景噪声的第一特定音频数据;基于所述第二特定音频数据在所述待处理音频数据中的位置,从所述待处理音频数据中将所述第二特定音频数据和延迟音频数据移除,得到目标音频。采用本发明所提供的音视频处理方法、合成方法、装置、电子设备及存储介质解决了现有技术中短视频多段录制过程中音视频合成时的背景音乐不连续的问题。
  • 视频处理方法合成装置电子设备存储介质
  • [发明专利]基于语音数据的推荐信息确定方法及相关装置-CN202310949116.9在审
  • 王一 - 深圳市人马互动科技有限公司
  • 2023-07-28 - 2023-10-13 - G10L25/57
  • 本申请提供了一种基于语音数据的推荐信息确定方法及相关装置,包括:获取推荐请求;获取所述用户针对参考历史推荐信息的参考语音互动数据;根据所述参考语音互动数据确定所述用户针对每个参考历史推荐信息的实际互动时长;确定所述实际互动时长大于第一预设时长的参考历史推荐信息为目标历史推荐信息;根据所述目标语音互动数据确定所述用户针对每个目标历史推荐信息的互动连续性;根据所述互动连续性从所述目标历史推荐信息中确定可用历史推荐信息;获取所述用户的基本信息;根据所述可用历史推荐信息、所述可用语音互动数据和所述基本信息确定目标推荐标签;根据所述目标推荐标签确定目标推荐信息。可以提高推荐信息的确定的准确度。
  • 基于语音数据推荐信息确定方法相关装置
  • [发明专利]一种音频处理方法、装置及计算机设备、存储介质-CN202310824711.X有效
  • 李廷天;肖鑫雨 - 腾讯科技(深圳)有限公司
  • 2023-07-06 - 2023-09-15 - G10L25/57
  • 本申请实施例提供一种音频处理方法、装置及计算机设备、存储介质。该音频处理方法涉及人工智能技术领域的音频处理技术,该音频处理方法包括:获取待处理的音频;对音频的每个音频片段进行特征分析,得到每个音频片段的特征信息;基于音频中的各个音频片段的特征信息,对每个音频片段进行拼接预测,得到每个音频片段的拼接预测结果;拼接预测结果用于指示相应音频片段中音频拼接点的包含情况;每个音频片段的拼接预测结果是基于每个音频片段的特征信息与其前序音频片段的特征信息进行拼接预测得到的;根据音频中的各个音频片段的拼接预测结果,对音频进行音频业务处理。采用本申请实施例,可以较为准确地对音频进行音频拼接点预测。
  • 一种音频处理方法装置计算机设备存储介质
  • [发明专利]音口同步识别方法、音口同步识别网络的训练方法及装置-CN202310447732.4在审
  • 王镜茹 - 京东方科技集团股份有限公司;北京京东方技术开发有限公司
  • 2023-04-24 - 2023-07-04 - G10L25/57
  • 本发明提供一种音口同步识别方法、音口同步识别网络的训练方法及装置,该音口同步识别方法包括:获取待识别视频的第一音频信号,第一音频信号的时长为第一时长;获取待识别视频中的与第一音频信号对应的N帧视频帧,N根据第一时长和待识别视频的帧率确定;获取N帧视频帧中的唇部关键点信息;将第一音频信号输入到音口同步识别网络的音频编码器中进行编码处理得到音频特征向量;将唇部关键点信息输入到音口同步识别网络的图像编码器中进行编码处理得到图像特征向量;采用音口同步识别网络的损失函数确定音频特征向量和图像特征向量之间的距离,根据距离确定音口是否同步。本发明能够对不同帧率的视频进行音口同步识别。
  • 同步识别方法网络训练装置
  • [发明专利]声音检测方法及相关设备-CN202310000609.8有效
  • 顾海军;赵刚强;金伟;应红力 - 杭州觅睿科技股份有限公司
  • 2023-01-03 - 2023-06-20 - G10L25/57
  • 本申请公开了一种声音检测方法、装置、电子设备及计算机可读存储介质,方法包括:获取关于目标对象的音视频数据,在所述音视频数据中提取获得音频数据和图像数据;分别对所述音频数据和所述图像数据进行特征提取,获得音频特征和图像特征;将所述音频特征和所述图像特征输入至声源定位模型进行处理;当所述声源定位模型输出关于所述目标对象的声源定位图时,利用多模态特征融合模型对所述声源定位图和所述音频特征进行识别,确定所述音视频数据中是否存在所述目标对象的目标音频。应用本申请提供的技术方案,可以有效减少漏检、误检问题,提高声音检测结果的准确性。
  • 声音检测方法相关设备
  • [发明专利]一种音视频处理方法、装置、设备及介质-CN202211511151.4在审
  • 豆红雷 - 杭州华橙软件技术有限公司
  • 2022-11-29 - 2023-04-04 - G10L25/57
  • 本申请提供一种音视频处理方法、装置、设备及介质,用于提高音视频播放的智能性,提高用户体验。该方法包括:第一设备获取摄像机采集的第一音视频数据;第一设备从第一音频数据中提取至少一个第一声音特征,从第一视频数据中提取至少一个第一人物特征;第一设备根据声音特征和人物特征的映射信息,确定至少一个第一声音特征与至少一个第一人物特征的对应关系;第一设备根据至少一个第一声音特征与至少一个第一人物特征的对应关系处理第一音视频数据,得到第二音视频数据;第一设备向第二设备发送第二音视频数据;第二设备播放第二音视频数据,在播放到人声时,视频画面中对应至少一个人物的图像区域上显示有标记信息。
  • 一种视频处理方法装置设备介质
  • [发明专利]语音处理方法和模型训练方法及电子设备-CN202111148233.2在审
  • 范泛;罗敬昊 - 华为技术有限公司
  • 2021-09-29 - 2023-03-31 - G10L25/57
  • 本申请实施例提供了一种语音处理方法和模型训练方法及电子设备。该语音处理方法包括:当确定视频画面发生变焦时,获取变焦参数、所述视频的第一视频语音数据和画面变焦后的视频画面数据;然后通过对所述变焦后的视频画面数据和所述第一视频语音数据进行多模态融合处理,以得到第二视频语音数据;接着,基于所述变焦参数对所述第二视频语音数据进行变焦,得到第三视频语音数据,输出所述第三视频语音数据。这样,通过多模态融合处理,有效的抑制视频语音数据中的噪声和混响,进而仅对抑制噪声和混响后的视频语音数据进行变焦,能够提高变焦后的视频语音数据的质量,以及提高用户体验。
  • 语音处理方法模型训练电子设备
  • [发明专利]基于视频彩铃识别客户的方法、系统、装置及存储介质-CN202111570117.X有效
  • 魏颖鹏 - 天翼爱音乐文化科技有限公司
  • 2021-12-21 - 2023-03-14 - G10L25/57
  • 本申请公开了一种基于视频彩铃识别客户的方法、系统、装置及存储介质。该方法通过获取视频彩铃信息并将其输入UNet神经网络模块,得到视频语音信息,并对其进行语音识别处理,得到视频语音文本信息;获取关键帧图像信息并对其进行处理,得到关键帧文字信息和关键帧标题信息;将视频语音文本信息、关键帧文字信息和关键帧标题信息输入标签动态调整模块,得到识别的客户信息。该系统包括第一获取模块、第一处理模块、第二处理模块、第二获取模块、第三处理模块、第四处理模块和第五处理模块。上述方法能够通过视频彩铃识别客户,有利于降低人力成本,有利于提升识别效率,同时,有利于缓解客户敏感信息泄露的风险。本申请可应用于人工智能技术领域。
  • 基于视频识别客户方法系统装置存储介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top