专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果10870291个,建议您升级VIP下载更多相关专利
  • [发明专利]基于yolov3手语识别技术-CN202010961692.1在审
  • 王斌;杨晓春;曲彦秋 - 东北大学
  • 2020-09-14 - 2020-12-29 - G06K9/00
  • 本发明涉及基于yolov3手语识别技术,解决了现有技术中哑语识别系统的识别率低和实时性差的问题。基于yolov3手语识别技术,所述技术包括以下步骤:S1:采集手的手掌和手腕关节点的坐标信息,并对肢体及面部表情进行关键点标定。算法的局部和整体的特征图谱的堆叠形成哑语句子,从而实现了哑语的翻译,利用现有成熟的yolov3算法和end2end模型组合,形成了一套可实时翻译的手语识别技术,实现了一种识别率高、实时性强的基于yolov3手语识别技术
  • 基于yolov3端到端手语识别技术
  • [发明专利]多讲话者视听自动语音识别-CN202080071967.2在审
  • 奥塔维奥·布拉加 - 谷歌有限责任公司
  • 2020-10-02 - 2022-06-10 - G10L15/06
  • 用于从视听数据(204)转录语音的单一视听自动语音识别(AV‑ASR)模型(200)包括编码器前端(260)和解码器(280)。编码器前端包括注意力机制(270),该注意力机制被配置成接收视听数据的音频轨迹(210)和视频部分(220)。视频部分包括多个视频面部轨迹(230),每个视频面部轨迹与相应人的面部相关联。对于每个视频面部轨迹,注意力机制被配置成确定以下置信度分数,该置信度分数指示与视频面部轨迹相关联的相应人的面部包括音频轨迹的讲话面部的可能性。解码器被配置成处理音频轨迹和多个视频面部轨迹中的与最高置信度分数相关联的视频面部轨迹以确定音频轨迹的语音识别结果(248)。
  • 端到端多讲话视听自动语音识别

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top