专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果88个,建议您升级VIP下载更多相关专利
  • [发明专利]选择性会议摘要-CN202110568563.0有效
  • R·J·卡特莱特;孙学京 - 杜比实验室特许公司
  • 2016-02-03 - 2023-09-19 - G10L15/183
  • 本公开涉及选择性会议摘要。各种公开的实现涉及对涉及多个会议参与者的会议的记录的处理和/或回放。本文公开的一些实现涉及接收对应于涉及多个会议参与者的至少一个会议的记录的音频数据。在一些示例中,所接收的音频数据的仅一部分将被选择作为回放音频数据。该选择过程可包括主题选择过程,讲话突发过滤过程,和/或声学特征选择过程。一些示例包括接收目标回放持续时间的指示。选择音频数据的该部分可包括使得回放音频数据的持续时间处于目标回放持续时间的阈值时间差内。
  • 选择性会议摘要
  • [发明专利]具有智能重传和插值的服务中质量监视系统-CN202110844977.1有效
  • 黄申;金度锡;孙学京 - 杜比实验室特许公司
  • 2016-06-01 - 2023-07-11 - H04L65/80
  • 本公开涉及具有智能重传和插值的服务中质量监视系统。接收对用于通信客户端的通信服务的服务请求。作为响应,将通信服务网络设置为支持通信服务。对于每个通信客户端产生路由元数据。路由元数据将被每个通信客户端用于通过轻量级对等(P2P)网络与相应的对等通信客户端共享服务质量信息。将路由元数据下载到每个通信客户端。通信客户端可以通过通信服务网络交换服务信令包或服务数据包。当通信客户端确定在从通信服务器接收的位流中存在有问题区域时,通信客户端可以向对等通信客户端请求与有问题区域相关的服务质量信息部分。
  • 具有智能服务质量监视系统
  • [发明专利]一种全景声编解码方法及系统-CN202211348711.9在审
  • 孙学京;郭红阳;薛涛;余俊 - 北京时代拓灵科技有限公司
  • 2022-10-31 - 2023-03-31 - G10L19/008
  • 本发明公开了一种全景声编解码方法及系统,结合音频对象的内容和特性判断是否是重要音频对象,并针对重要音频对象和非重要音频对象采用不同的方法进行编码处理;结合音频对象的内容和特性进行分类处理,并根据分类结果采用不同的方法进行编码处理。针对大型复杂的多对象场景,结合音频对象的内容和特性以及Ambisonics特性,针对音频对象进行处理,可以智能组合HOA(HigherOrderAmbisonics,高阶Ambisonics)和基于通道、对象的音频,实现在保证音频质量的情况下,最大限度的压缩带宽,同时保持原有对象音频系统的灵活性。
  • 一种全景解码方法系统
  • [发明专利]一种构建车内个人声场的方法及装置-CN202211365969.X在审
  • 孙学京;郭红阳;薛涛;余俊 - 北京时代拓灵科技有限公司
  • 2022-10-31 - 2023-03-03 - H04S7/00
  • 本发明公开了一种构建车内个人声场的方法,通过获取车载扬声器的数量、车载扬声器的位置和车内用户的目标位置,根据车载扬声器的位置和车内用户的目标位置,确定虚拟扬声器的位置和虚拟扬声器的转换函数,根据车载扬声器的数量,确定NFC‑HOA解码中次级声源的位置;根据次级声源的位置和虚拟扬声器的位置,确定NFC‑HOA驱动函数和次级声源的VBAP增益;根据虚拟扬声器的转换函数、次级声源的VBAP增益和NFC‑HOA驱动函数,得到车内用户的目标声场的音频信号。从而实现了以车内用户的目标位置为声场中心来重建车内声场,使得车内用户位于重建车内声场的中心位置处,进而保证重建车内声场的质量,用户体验好。
  • 一种构建个人声场方法装置
  • [发明专利]一种音频编解码方法及装置-CN202210816902.7在审
  • 孙学京;郭红阳 - 南京拓灵智能科技有限公司
  • 2022-07-12 - 2023-02-03 - G10L19/008
  • 本申请公开了一种音频编解码方法及装置,本方法首先获取待处理的全景声音频信号,全景声音频信号至少包括stereo音频信号、5.1声道音频信号、ambisonics音频信号中的一种;将待处理的全景声音频信号输入至预先训练的编码神经网络进行编码得到比特流;将比特流输入至预先训练的解码神经网络进行解码得到重构的音频信号。本发明基于AI,针对多声道音频采用数据驱动的方式进行编解码处理,可以在低延迟下实现音频信号的低码率高质量传输。
  • 一种音频解码方法装置
  • [发明专利]一种基于多模态的沉浸声生成方法及装置-CN202210546087.7在审
  • 徐涛;董强国;孙学京;周令非;张辉 - 中国电影科学技术研究所
  • 2022-05-19 - 2022-08-26 - G10L21/0272
  • 本申请公开了一种基于多模态的沉浸声生成方法及装置。本方法首先获取样本视频的视频信息和音频信息;其中,音频信息为多声道音频信息,包括左声道音频信号和右声道音频信号;然后将样本视频的视频信息和音频信息输入至上混处理模型中进行训练,得到上混处理模型的模型参数,并基于模型参数对上混处理模型进行更新;最后将目标视频的视频信息、左声道音频信号以及右声道音频信号输入更新后的上混处理模型中进行声源分离,得到直接声源和背景声。本发明结合视频信息,针对多声道音频进行上混处理,可以有效提升沉浸声音效,保证视音视频播放内容的一致性,进而有效提升沉浸声播放效果。
  • 一种基于多模态沉浸生成方法装置
  • [发明专利]一种沉浸式音频上混方法及系统-CN202110111130.2有效
  • 孙学京;李旭阳 - 北京拓灵新声科技有限公司
  • 2021-01-27 - 2022-07-15 - H04S7/00
  • 本发明公开了一种沉浸式音频上混方法及系统,通过获取输入的立体声音频信号,采用深度学习声源分离模型将立体声音频信号分离为声源信号和环境音信号;采用深度学习声源分离模型将声源信号分离为中置音源信号和低音信号;采用深度学习声源分离模型对环境音信号进行去相关处理,获得左环绕声音频信号和右环绕声音频信号;获取输入的左声道音频信号和右声道音频信号,将中置音源信号、低音信号、左环绕声音频信号、右环绕声音频信号、左声道音频信号和右声道音频信号合并得到5.1声道音频信号。本发明基于神经网络对输入立体声音频信号进行实时处理,音源和环境音能够有效区分,能够得到多声道音频信号,进而提升沉浸式效果。
  • 一种沉浸音频方法系统
  • [发明专利]时域滤波中的滤波器系数更新-CN201510599861.0有效
  • 施栋;孙学京 - 杜比实验室特许公司
  • 2015-09-18 - 2022-01-11 - H03H21/00
  • 本文中公开的示例实施例涉及时域滤波中的滤波器系数更新。公开了一种处理音频信号的方法。该方法包括通过分析音频信号的第一部分来获得针对音频信号的第一部分的预定数目的目标增益。目标增益中的每个目标增益对应于音频信号的线性子带。该方法还包括通过迭代地执行以下操作来确定用于对音频信号的第一部分进行滤波的滤波器系数:从目标增益中选择至少一个目标增益,以及基于所选择的至少一个目标增益来更新滤波器系数。还公开了相应的处理音频信号的系统和计算机程序产品。
  • 时域滤波中的滤波器系数更新
  • [发明专利]音频信号的下混方法、装置、计算机设备及可读存储介质-CN201911173782.8有效
  • 王薇娜;高五峰;董强国;孙学京 - 中国电影科学技术研究所
  • 2019-11-26 - 2021-12-07 - G10L19/008
  • 本发明公开一种音频信号的下混方法、装置、计算机设备及可读存储介质。该方法包括:将多声道音频信号乘以双声道转换系数,获得左声道音频信号及右声道音频信号;分别对多声道音频信号、左声道音频信号及右声道音频信号进行转换,生成多声道频域信号、第一左声道频域信号及第一右声道频域信号;基于头相关传输模型处理多声道频域信号,获得第二左声道频域信号及第二右声道频域信号;对第一左声道频域信号和第二左声道频域信号进行加权,生成下混左声道频域信号,对第一右声道频域信号和第二右声道频域信号进行加权,生成下混右声道频域信号;对下混左声道频域信号及下混右声道频域信号进行转换,生成下混左声道音频信号及下混右声道音频信号。
  • 音频信号方法装置计算机设备可读存储介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top