专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果175191个,建议您升级VIP下载更多相关专利
  • [发明专利]一种视听播放装置及其播放方法-CN200410027593.7有效
  • 黄光明;向锋;成晓华 - 深圳市朗科科技有限公司
  • 2004-06-08 - 2005-12-14 - G10L15/08
  • 本发明公开了一种视听播放装置及其播放方法,所述的装置包括:操作输入单元、语音输入单元、模数变换器、存储器单元、语音识别处理单元、视听数据处理单元、视听数据存储单元、数模变换器以及视听数据输出单元,通过转换输入的语音指令成相应的操作指令,控制视听播放装置。本发明的识别语音指令的视听播放装置能够通过语音识别处理单元使用语音实现对视听播放装置的操作。通过语音指令替代原来的按键指令。用户只须对此装置发出语音指令,设备即能听明白用户的意思,并执行相应的操作,这样能够使视听播放装置更加小型化,便于携带。
  • 一种视听播放装置及其方法
  • [发明专利]视听语音分离模型的训练方法、电子设备和存储介质-CN202211573033.6在审
  • 钱彦旻;吴逸飞;李晨达 - 思必驰科技股份有限公司
  • 2022-12-08 - 2023-06-23 - G10L21/0272
  • 本发明实施例提供一种视听语音分离模型的训练方法、电子设备和存储介质。该方法包括:将多个说话人的混合训练音频输入至视听语音分离模型,得到多个说话人的预测频谱图;确定预测频谱图的预测说话人视听特征以及混合训练音频的参考频谱图的参考说话人视听特征;基于预测说话人视听特征以及参考说话人视听特征确定的跨模态损失,通过交叉方向乘子法利用跨模态损失对视听语音分离模型进行混合精度量化条件的训练,得到轻量级的视听语音分离模型。本发明实施例基于交叉方向乘子法对模型进行量化调优训练出轻量级的视听语音分离模型,并且通过多模态模型能够充分利用不同模态对量化敏感度特性确保了轻量级的视听语音分离模型计算量与性能的平衡。
  • 视听语音分离模型训练方法电子设备存储介质
  • [发明专利]一种基于卷积块注意机制的视听双模态语音识别方法-CN202011080817.6有效
  • 王兴梅;赵一旭;孙卫琦 - 哈尔滨工程大学
  • 2020-10-11 - 2022-10-14 - G10L15/02
  • 本发明提供一种基于卷积块注意机制的视听双模态语音识别方法,包括如下步骤:(1)对视听双模态信息数据集进行预处理;(2)提出构建CBAM‑AV‑LipNet模型;(3)完成基于卷积块注意机制的视听双模态语音识别任务,实现视听双模态语音识别任务。本发明利用提出构建的CBAM‑AV‑LipNet模型对测试集进行特征提取得到深层融合特征向量,对其进行CTC贪婪搜索解码,获得识别文本信息,完成视听双模态语音识别任务。本发明提出的基于卷积块注意机制的视听双模态语音识别方法较传统的语音识别方法和视觉语音识别模型LipNet具有良好的识别性能和收敛速度,同时具有一定的抗噪能力和有效性。
  • 一种基于卷积注意机制视听双模语音识别方法
  • [发明专利]智能多媒体视听图像处理方法、系统及存储介质-CN202310659951.9在审
  • 张正;骆真;蔡春明 - 深圳市艾姆诗电商股份有限公司
  • 2023-06-06 - 2023-09-05 - H04L12/18
  • 本发明涉及多媒体信息处理的技术领域,特别是涉及一种智能多媒体视听图像处理方法、系统及存储介质,其能够提高会议总结效率;所述方法包括以下步骤:S1、获取与会人员的语音、人脸视频以及多媒体播放图像;S2、利用预先训练的会议视听分析模型识别与会人员的语音及人脸视频;S3、根据会议视听分析模型的识别结果,获取每个与会人员的语音时间节点;S4、根据语音时间节点,截取相同时间内语音对应的与会人员的人脸视频和多媒体播放图像;S5、将相同时间节点内的语音、人脸视频以及多媒体播放图像转换成同屏双显的单个视听文件;S6、根据会议视听分析模型的识别结果,为每位与会人员建立个人视听库,并存储属于该与会人员的多个视听文件。
  • 智能多媒体视听图像处理方法系统存储介质
  • [发明专利]基于视听多模态融合的土家语语音识别方法-CN202310763651.5在审
  • 于重重;徐小龙;钱兆鹏;于佳圻 - 北京工商大学
  • 2023-06-27 - 2023-09-05 - G10L15/00
  • 本发明公布了一种基于视听多模态融合的土家语语音识别方法,构建结合注意力机制与动态梯度下降DGM策略的基于视听多模态融合的土家语语音识别模型,对语音进行识别;在模型训练时使用视频数据对音频数据进行增强;构建的模型包括:特征提取模块、视听融合模块、动态梯度下降模块、土家语识别模块;视听融合模块是基于多头注意力机制,完成视频特征和音频特征的数据融合;动态梯度下降模块用于调控各模态的优化速度,结合视听融合模块完成模型的训练;使用链接时序分类CTC方法实现待识别语音的识别。本发明能够提高土家语语音识别的准确率。
  • 基于视听多模态融合土家语音识别方法
  • [发明专利]一种基于视听融合的管制员语音识别方法及装置-CN202310090186.3有效
  • 林毅;郭东岳 - 四川大学
  • 2023-02-09 - 2023-04-25 - G10L15/06
  • 本发明公开了一种基于视听融合的管制员语音识别方法及装置,包括以下步骤:步骤1:采集管制员视听数据,对视听数据进行预处理构建视听数据集;步骤2:构建语音表示模型并进行预训练;步骤3:构建视频表示模型并进行预训练;视频表示模型包括帧内表示模型和帧间表示模型;步骤4:根据步骤2和步骤3得到的模型构建语音‑视频联合自编码器,并进行预训练;步骤5:构建语音识别模块,语音识别模块和语音‑视频联合自编码器构成基于双模态融合的空管语音识别网络,并对基于双模态融合的空管语音识别网络进行监督训练。本发明为语音识别任务提供具有丰富语义的补充信息,提升了管制员语音识别的准确率。
  • 一种基于视听融合管制语音识别方法装置
  • [发明专利]视听语音识别方法、装置、设备、介质及产品-CN202211519550.5在审
  • 郭加伟 - 中国农业银行股份有限公司
  • 2022-11-30 - 2023-03-31 - G10L15/02
  • 本申请提供一种视听语音识别方法、装置、设备、介质及产品,该方法包括:获取待识别的视频特征和对应的含噪语谱图;所述视频特征为基于用户的唇部图像提取的特征;所述含噪语谱图为基于用户的音频数据提取生成的;将所述视频特征和所述含噪语谱图输入预设视听语音增强模型进行降噪处理,输出对应的增强语谱图;将所述增强语谱图和所述视频特征输入预设视听语音识别模型进行语音识别,输出对应的最终字符序列。本申请的视听语音识别方法,通过预设视听语音识别模型对增强语谱图和视频特征两种模态进行识别,以两种模态互补的方式,提高最终字符序列的准确性,从而提高了语音识别的准确性。
  • 视听语音识别方法装置设备介质产品
  • [发明专利]一种低侵入性的视听语音分离方法及系统-CN202211005193.0在审
  • 王坤朋;李文娜;姚娟;刘忠仁;周浩;张江梅;冯兴华;张春峰 - 西南科技大学
  • 2022-08-22 - 2022-11-22 - G10L21/0272
  • 本发明公开了一种低侵入性的视听语音分离方法及系统,该方法包括以下步骤:获取视频中不同目标对象的人脸图像之间不具备隐私侵入性的分辨率;基于不具备隐私侵入性的分辨率,选取多种分辨率的音视频训练数据集并预处理;构建低侵入性视听语音分离模型;利用预处理后的数据训练视听语音分离模型;将待分离的视听语音输入已训练好的视听语音分离模型中,分离出各目标对象的语音。本发明构建了一种新的视觉模态模型,将视觉特征的提取分为双支路结构,该结构同时融合了说话人的动态特征与语义特征,可在人脸图像分辨率不具备隐私侵入性的情况下有效关注可辅助语音分离的唇部动态特征,这使系统既能达到语音分离的目的又可以保护使用者的隐私信息
  • 一种侵入视听语音分离方法系统
  • [发明专利]一种心肺复苏反馈手套-CN202110556820.9在审
  • 唐丽雯;王旭 - 久心医疗科技(苏州)有限公司
  • 2021-05-21 - 2021-08-27 - A61H31/00
  • 本发明公开了一种心肺复苏反馈手套,包括心肺复苏反馈手套本体、测量单元、视听单元、控制单元;测量单元通过传感器获取按压频率、按压深度数据,传送给控制单元;控制单元进行数据分析得到判断结果,传送给视听单元;视听单元给出操作者具体的操作提示。视听单元包括频率反馈指示灯,深度反馈指示灯,侧边语音口。进行心肺复苏的同时,提供视觉、语音实时反馈。若操作者按压频率、按压深度正确,则给予操作者正向的反馈,否则,通过灯光和/或语音提示操作者及时做出调整,实施正确的心肺复苏。本发明结构简单,易于携带,安全性高,方便使用;配有视听双重反馈,指导精准按压,方便操作者准确及时救治;与手部直接接触,按压时不易发生移位。
  • 一种复苏反馈手套

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top