[发明专利]一种基于语音的视频倍速播放方法及系统有效
申请号: | 201910443874.7 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110177298B | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 唐文滔;李兴平;曹问;刘维 | 申请(专利权)人: | 湖南快乐阳光互动娱乐传媒有限公司 |
主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N21/44;H04N21/462;H04N21/845 |
代理公司: | 长沙正奇专利事务所有限责任公司 43113 | 代理人: | 李美丽 |
地址: | 410001 湖南省长沙市*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语音 视频 播放 方法 系统 | ||
本发明公开了一种基于语音的视频倍速播放方法及系统,在视频文件预处理时包括:步骤A,读取视频文件中的语音信息;步骤B,对语音信息进行分析,根据其快慢将视频文件分解为多段子视频,获得各子视频段基于对应语音信息的倍速速率;步骤C,利用各子视频段对应的倍速速率形成倍速描述文件;在视频文件播放时包括:步骤D,加载并解析倍速描述文件;步骤E,视频文件播放至某子视频段时,根据倍速描述文件中的该子视频段对应的倍速速率播放视频文件。本发明能够通过视频中的语音自动计算倍速速率,使得用户能够以智能变化的最合适的倍速速率看完整部视频,在视频倍速播放过程中,倍速速率能够进行自动智能调整,无需用户手动调整,用户体验好。
技术领域
本发明属于视频倍速播放技术领域,特别涉及一种基于语音的视频倍速播放方法及系统。
背景技术
观看视频时,尤其是观看网络视频时,若需要尽快看完一部视频,用户通常会选择倍速播放。
目前市场上现有视频播放终端均提供了固定倍速支持,但所有播放器均无自动倍速支持,因而需要用户根据视频中的语音播放快慢切换播放倍速速率,即需要人工判断并选择合适的倍速速率播放,而无法做到自动倍速或智能倍速播放。
发明内容
本发明的目的在于,针对上述现有技术的不足,提供一种基于语音的视频倍速播放方法及系统,能够通过视频中的语音自动计算倍速速率,使得用户能够以智能变化的最合适的倍速速率看完整部视频,在视频倍速播放过程中,倍速速率能够进行自动智能调整,而无需用户手动调整倍速速率,用户体验好。
为解决上述技术问题,本发明所采用的技术方案是:
一种基于语音的视频倍速播放方法,其特点是:
在视频文件预处理时,包括以下步骤:
步骤A,读取视频文件中的语音信息;
步骤B,对所述语音信息进行分析,根据语音信息的快慢将视频文件分解为对应的多段子视频,并获得各子视频段基于对应语音信息的倍速速率;
步骤C,利用各子视频段对应的倍速速率按照时间顺序形成倍速描述文件;
在视频文件播放时,包括以下步骤:
步骤D,加载并解析倍速描述文件;
步骤E,视频文件播放至某子视频段时,根据倍速描述文件中的该子视频段对应的倍速速率播放视频文件。
作为一种优选方式,所述步骤B中,各子视频段基于语音信息的倍速速率确定方法为:根据语音信息识别结果,计算吐词速度,对比90%以上人群能够听懂的最快吐词速度,计算各子视频段的倍速速率。
作为另一种优选方式,所述步骤B中,各子视频段基于语音信息的倍速速率确定方法为:使用机器学习方法训练语音倍速播放模型,将语音信息识别结果输入语音倍速播放模型,获得各子视频段的倍速速率。
作为一种优选方式,倍速描述文件和对应的视频文件一起分发。
基于同一个发明构思,本发明还提供了一种基于语音的视频倍速播放系统,其特点是包括:
语音信息读取单元:用于在视频文件播放器读取视频文件中的语音信息;
语音信息分析单元:用于对语音信息读取单元读取的语音信息进行分析,根据语音信息的快慢将视频文件分解为对应的多段子视频,并获得各子视频段基于对应语音信息的倍速速率;
倍速描述文件形成单元:用于利用各子视频段对应的倍速速率按照时间顺序形成倍速描述文件;
播放器:用于播放视频文件,并用于加载并解析倍速描述文件;在视频文件播放至某子视频段时,根据倍速描述文件中的该子视频段对应的倍速速率播放视频文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南快乐阳光互动娱乐传媒有限公司,未经湖南快乐阳光互动娱乐传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910443874.7/2.html,转载请声明来源钻瓜专利网。