[发明专利]视频处理设备和视频处理方法有效
申请号: | 201010194764.0 | 申请日: | 2010-06-04 |
公开(公告)号: | CN101909191A | 公开(公告)日: | 2010-12-08 |
发明(设计)人: | 岩田拓也 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | H04N5/92 | 分类号: | H04N5/92;H04N5/93 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 日本东京都大*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 处理 设备 方法 | ||
技术领域
本发明涉及用于对能够容易地听清声音或话音(或语音)的视频图像重放速度进行控制的视频处理设备和视频处理方法。
背景技术
近年来,能够以从约30fps(帧每秒(frame per second))的低帧频到超过1000fps的各种帧频拍摄图像的摄像机已经得到使用。利用该摄像机,可以在拍摄期间动态地切换拍摄帧频。另一方面,在视频播放器上重放图像时的帧频通常为60fps或120fps。
通过使用摄像机的拍摄帧频和视频播放器的重放帧频之间的差别,可以获得具有特殊图像效果的图像显示。例如,当拍摄帧频高于重放帧频时,所显示的图像变为平滑运动的慢放图像(slow play image)。另一方面,当拍摄帧频低于重放帧频时,所显示的图像变为快速运动的快放图像(fast play image)。
另一方面,当慢速重放包括音频数据的图像时,声音的重放速度变慢,从而重放声音的音域(compass)变得低于实际范围,并且有时难以听清声音或话音(语音)。另一方面,当快速重放图像时,重放声音的音域变得高于实际范围,并且有时难以听清声音或话音。
日本特开2002-314945号公报记载了一种语速转换系统(speech rate conversion system),其中该系统检测图像的有声部分和无声部分,并且基于由用户指定的重放速度部分地删除无声部分的音频数据,由此生成要输出的音频数据。
然而,在传统技术中,基于由用户设置的重放速度均一地校正了音频数据。因此,不总是输出容易听清的声音。此外,如果在单个视频内容中包括具有不同拍摄(记录)帧频的多帧频视频内容,则难以适当地校正音频数据。
发明内容
本发明涉及能够控制重放速度以使得对具有声音或话音的视频内容的重放能够被用户容易听清的图像处理设备和图像处理方法。
根据本发明的一方面,提供一种视频处理设备,能够在多个重放模式下对所记录的视频内容进行重放,所述视频处理设备包括:声音信息生成单元,用于分析视频内容的音频数据的频率特性,并生成声音特性信息;重放速度确定单元,用于基于所述声音特性信息和预定声音参数,确定适当重放速度范围;控制单元,用于根据所选择的重放模式,确定所述适当重放速度范围内的特定重放速度;视频处理单元,用于基于所述特定重放速度,对所述视频内容的视频数据进行帧间隔剔除和/或插值处理;以及视频输出单元,用于将经过所述帧间隔剔除和/或插值处理的视频数据输出至显示单元。
根据本发明的另一方面,提供一种视频处理方法,用于在多个重放模式下对所记录的视频内容进行重放,所述视频处理方法包括以下步骤:分析视频内容的音频数据的频率特性,并生成声音特性信息;基于所述声音特性信息和预定声音参数,确定适当重放速度范围;根据所选择的重放模式,确定所述适当重放速度范围内的特定重放速度;基于所述特定重放速度,对所述视频内容的视频数据进行帧间隔剔除和/或插值处理;以及将经过所述帧间隔剔除和/或插值处理的视频数据输出至显示单元。
根据本发明,由于基于声音分析结果控制视频内容的重放速度,因而能够在声音或话音可辨别的范围内进行慢重放和快重放。还能够在保持拍摄者拍摄时想要的图像效果的同时,以容易听清的清晰声音重放多帧频视频内容。
通过以下参考附图对典型实施例的详细说明,本发明的其它特征和方面将变得明显。
附图说明
包含在说明书中并构成说明书一部分的附图示出了本发明的典型实施例、特征和方面,并且与说明书一起用来解释本发明的原理。
图1是示出根据本发明典型实施例的视频重放设备的框图。
图2示出根据本发明典型实施例的用户选择画面。
图3示出根据本发明典型实施例的适当重放速度范围。
图4是示出根据本发明典型实施例的重放处理的流程图。
图5是示出根据本发明典型实施例的另一重放处理的流程图。
图6是示出根据本发明典型实施例的重放速度确定单元的框图。
具体实施方式
以下将参考附图详细说明本发明的各种典型实施例、特征和方面。
图1是示出根据本发明典型实施例的视频重放设备100的示例的框图。
存储单元101是用以存储视频内容的硬盘驱动器(HDD)或闪速存储器。视频内容是由多个具有不同拍摄帧频的视频场景构成的多帧频视频内容,并且视频内容包括根据运动图片专家组(Moving Picture Experts Group,MPEG)格式进行编码的音频数据和视频数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010194764.0/2.html,转载请声明来源钻瓜专利网。