[发明专利]使用嘴唇和牙齿特征来测量音频视频同步的方法、系统和程序产品无效
申请号: | 200680021184.3 | 申请日: | 2006-04-13 |
公开(公告)号: | CN101199208A | 公开(公告)日: | 2008-06-11 |
发明(设计)人: | J·库珀;米尔科·杜山·沃吉诺维科;克里斯多佛·史密斯;吉班阿南达·罗伊;萨乌拉博·简恩 | 申请(专利权)人: | 皮克索尔仪器公司 |
主分类号: | H04N9/475 | 分类号: | H04N9/475 |
代理公司: | 北京安信方达知识产权代理有限公司 | 代理人: | 陈怡;郑霞 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 用于测量音频视频同步的方法、系统和程序产品。这通过首先采集音频视频信息进入音频视频同步系统内来完成。数据采集的步骤之后,分析音频信息和分析视频信息。接着,分析视频信息以在其中定位与讲话者个人语音特征有关的声音的出现。在分析阶段,根据音频和视频信息计算音频和视频MuEv-S,且将音频和视频信息分类为包括AA、EE、OO、B、V、TH、F、无声、其它音素以及未分类音位的元音音素。嘴唇之间的内部空间也被识别和确认。该信息用于确定和关联视频帧中的主要音频类别。确定匹配位置,以及确定视频和音频的偏移量。 | ||
搜索关键词: | 使用 嘴唇 牙齿 特征 测量 音频视频 同步 方法 系统 程序 产品 | ||
【主权项】:
1.一种用于测量音频视频同步的方法,所述方法包括步骤:接收组合的音频和视觉表现的视频部分和关联音频部分;分析所述音频部分来识别和过滤音频数据,以减少与讲话者的个人语音特征有关的音频数据,从而产生过滤的音频信号;分析所述过滤的音频信号,以在其中定位特定音位的出现;分析所述视频部分,以通过分析嘴部区域来在所述视频部分中定位特定视位的出现;以及分析所述音位和视位,以确定其相关的音位和视位的相对定时。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皮克索尔仪器公司,未经皮克索尔仪器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200680021184.3/,转载请声明来源钻瓜专利网。
- 同类专利
- 用外部信息同步MIDI文件的方法和系统-201680087905.4
- 燕斌;刘晓露 - 森兰信息科技(上海)有限公司
- 2016-10-14 - 2022-01-25 - H04N9/475
- 本申请涉及使MIDI文件与视频同步的方法包括获取视频和MIDI文件,以及识别视频帧的时间信息。该方法还包括将时间信息转换为时间戳信息和编辑MIDI文件的时间戳。该方法还包括检测对应于视频帧的MIDI文件,并基于所述对应于视频的MIDI文件演奏乐器。
- 应用于视频信号锁相的方法与相关装置-201210056940.3
- 翁尉书 - 晨星软件研发(深圳)有限公司;晨星半导体股份有限公司
- 2012-03-06 - 2013-09-18 - H04N9/475
- 本发明提供应用于视频信号锁相的方法与相关装置。视频信号包括多个图场,各图场中依序交错排列多笔第一线信号与第二线信号,各第一线信号中具有一对应的第一色同步信号。本发明先于一第一图场内依据预设数目个第一色同步信号的相位提供一相位模态,再遵循一第一模态切换原则以依据该相位模态而为一第二图场的各第一色同步信号提供对应的参考相位,并根据参考相位对第二图场中的各第一色同步信号进行锁相。若锁相失败,则改循一第二模态切换原则以依据一第三图场的相位模态而为一第四图场的各第一色同步信号提供参考相位。
- 有选择地修正用于输出设备的音频或视频数据的电子适配器单元-201180022625.2
- L·芬奇阿姆 - THX有限公司
- 2011-03-04 - 2013-01-16 - H04N9/475
- 本发明涉及有选择修正用于输出设备的音频或视频数据的独立或集成的电子单元。该电子单元具有一个或更多音频或视频输入端和用于输出修正的音频或视频源材料的一个或更多音频或视频输出端。该单元可以包括传感器、选择器和/或逻辑,该逻辑用于从多个修正曲线中选择并在将音频或视频源材料输送到输出设备之前,将选择的曲线应用于所述音频或视频源材料。修正曲线可用于适应用于特定类型的音频或视频播放或输出设备的音频或视频源。对于音频,修正曲线可以通过改变传递函数而修正音频质量,而对于视频,修正曲线可以用于通过改变视频源信号的视觉特性而修正视频质量。
- 将远程音频与固定视频同步-200880110762.X
- 迈克尔·E·拉塞尔;阿诺德·谢因曼 - 摩托罗拉公司
- 2008-09-30 - 2010-12-29 - H04N9/475
- 一种多媒体设备(100)包括:分割实体,其被配置为将多媒体流分割为音频帧和视频帧;排序实体,其被配置为向至少一个音频帧添加序号;收发信机,其被配置为向远程音频设备发射音频帧;控制器,其耦合到视频播放器,所述控制器被配置为根据所述序号来确定与向远程音频设备发射音频帧相关联的延迟,并且根据所述延迟来控制在视频播放器的视频帧的呈现。
- 用于独立于说话者特征测量音频视频同步的方法、系统和程序产品-200580050133.9
- J·卡尔·库珀;米尔科·杜山·沃吉诺维科;吉班阿南达·罗伊;萨乌拉博·简;克里斯多佛·史密斯 - 皮克索尔仪器公司
- 2005-11-16 - 2008-06-11 - H04N9/475
- 一种用于测量音频视频同步的方法、系统和程序产品。首先通过将音频视频信息采集进音频视频同步系统中,来执行。数据采集步骤之后,分析音频信息,并分析视频信息。接着,分析音频信息,以在其中定位与说话者的个人语音特征有关的声音的呈现。然后,通过去除与说话者的个人语音特征有关的数据,来过滤音频信息,以产生过滤的音频信息。在该阶段,分析过滤的音频信息和视频信息,确定音频和视频MuEv的判别边界,并使有关的音频和视频MuEv相关。在分析阶段,由音频和视频信息计算音频和视频MuEv,并将音频和视频信息分类为元音音素,包括AA、EE、OO、无声和未分类音位。该信息被用于确定并关联视频帧中的主要音频类别。确定匹配位置,并确定视频和音频的偏移量。
- 使用嘴唇和牙齿特征来测量音频视频同步的方法、系统和程序产品-200680021184.3
- J·库珀;米尔科·杜山·沃吉诺维科;克里斯多佛·史密斯;吉班阿南达·罗伊;萨乌拉博·简恩 - 皮克索尔仪器公司
- 2006-04-13 - 2008-06-11 - H04N9/475
- 用于测量音频视频同步的方法、系统和程序产品。这通过首先采集音频视频信息进入音频视频同步系统内来完成。数据采集的步骤之后,分析音频信息和分析视频信息。接着,分析视频信息以在其中定位与讲话者个人语音特征有关的声音的出现。在分析阶段,根据音频和视频信息计算音频和视频MuEv-S,且将音频和视频信息分类为包括AA、EE、OO、B、V、TH、F、无声、其它音素以及未分类音位的元音音素。嘴唇之间的内部空间也被识别和确认。该信息用于确定和关联视频帧中的主要音频类别。确定匹配位置,以及确定视频和音频的偏移量。
- 线性时间编码接收机-200480012555.2
- 约翰·约瑟夫·查尔迪 - 汤姆森许可贸易公司
- 2004-01-26 - 2007-07-04 - H04N9/475
- 一种用于接收和解码在电影和电视以及伴音中所使用的类型的LTC帧的线性时间编码(LTC)接收机(10),包括第一计数器(12),用于测量双相标记信号间隔的持续时间内的参考时钟周期的数目,以便产生用于从LTC帧中提取有效载荷的定时参考。第二计数器(16)检测LTC帧中的同步字段,以便建立LTC帧方向。第三计数器(18)用于对LTC帧中的符号的数目进行计数。状态机(12)响应第一、第二和第三计数器(14,16,18)的计数值,用于:(a)检测输入LTC帧中的有效同步序列;(b)确定LTC帧方向;(c)从LTC帧中解码(提取)有效载荷信息;以及(d)按照由LTC帧方向确定的顺序传送有效载荷信息。
- 媒体内容的基于音频和视频的媒体服务的自动同步-03825980.X
- 卡尔·C·H·胡;詹姆斯·A·斯特罗思曼 - 汤姆森特许公司
- 2003-02-14 - 2006-03-01 - H04N9/475
- 提供一种用于在第一媒体服务(400)和第二媒体服务(450)之间自动同步播放的方法,这两个服务都对应于同一媒体内容源。匹配第一媒体服务(400)与第二媒体服务(450)中共同的音频事件(499)。根据匹配步骤的结果,调节第一媒体服务(400)和第二媒体服务(450)中至少一个的播放定时,以便在第一媒体服务(400)和第二媒体服务(450)之间自动同步播放。
- 降低视讯应用中锁相回路晃动的方法-200510098309.X
- 朱昌志;黄文艺 - 宏芯科技股份有限公司
- 2005-09-07 - 2006-02-08 - H04N9/475
- 本发明提供一种降低视讯应用中模拟锁相回路晃动的方法。在垂直遮没期间以假的HSync信号取代HSync/Csync而输入锁相回路,因此模拟锁相回路将只看到固定周期的假HSync信号作为线锁定的触发信号,同时无需动量滑行(COAST)信号。而且假的HSync微调成配合外部的HSync/Csync前缘而使锁相回路的晃动减至最低。
- 专利分类