专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果3个,建议您升级VIP下载更多相关专利
  • [发明专利]端到端多讲话者视听自动语音识别-CN202080071967.2在审
  • 奥塔维奥·布拉加 - 谷歌有限责任公司
  • 2020-10-02 - 2022-06-10 - G10L15/06
  • 用于从视听数据(204)转录语音的单一视听自动语音识别(AV‑ASR)模型(200)包括编码器前端(260)和解码器(280)。编码器前端包括注意力机制(270),该注意力机制被配置成接收视听数据的音频轨迹(210)和视频部分(220)。视频部分包括多个视频面部轨迹(230),每个视频面部轨迹与相应人的面部相关联。对于每个视频面部轨迹,注意力机制被配置成确定以下置信度分数,该置信度分数指示与视频面部轨迹相关联的相应人的面部包括音频轨迹的讲话面部的可能性。解码器被配置成处理音频轨迹和多个视频面部轨迹中的与最高置信度分数相关联的视频面部轨迹以确定音频轨迹的语音识别结果(248)。
  • 端到端多讲话视听自动语音识别

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top