[发明专利]一种基于语音识别的视频播放控制方法和系统有效

申请号：	201210025924.8	申请日：	2012-02-07
公开（公告）号：	CN102568478A	公开（公告）日：	2012-07-11
发明（设计）人：	吴昊宇;邓龙;姚键;邱丹;潘柏宇;卢述奇;刘睿姝	申请（专利权）人：	合一网络技术（北京）有限公司
主分类号：	G10L15/26	分类号：	G10L15/26;G10L15/06;H04N21/432
代理公司：	北京德和衡律师事务所 11405	代理人：	姚克枫
地址：	100080 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于语音识别视频播放控制方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种视频控制方法，尤其涉及一种基于语音识别的视频播放控制方法，属于语音识别领域。

背景技术

目前，计算机语音识别的任务是让计算机能够听懂人类说话的语句或者命令，并做出相应的动作。

其中，从上世纪70年代开始，计算机语音识别技术在研究上取得了突破性的进展。现在计算机语音识别技术在各个领域都有广泛的应用，比如语音识别拨号，语音搜索，语音控制等。但是现有的计算机语音识别系统都存在一些问题。由于计算机语音识别需要进行大量的计算，所以现有的计算机语音识别计算基本上都是应用于单机的计算，或者需要下载并且安装特定的软件才能进行语音识别的任务，没有和互联网技术很好的结合。操作系统自带的语音识别系统只能完成特定的简单任务，与别的程序，或者与互联网应用没有连接，已经不能适应当今互联网的快速发展的需求。

由于人类的语言多种多样，而且同一个词的不同人的发音也不同，计算机语音识别从对人的语音的依赖程度上，按照声学模型建立的方式进行划分，可以分为特定人识别和非特定人语音识别系统。

发明内容

本发明针对现有技术的缺点，提供了一种基于语音识别的视频播放控制方法，该方法能够具有较灵活的视频控制效果。此外，本发明还公开了一种基于语音识别的视频播放控制系统。

根据本发明的第一目的，本发明提供了一种基于语音识别的视频播放控制方法，包括：

对用户的语音进行训练提取语音特征并保存在语音特征库中；

接收用户的语音控制命令，与所述保存的用户语音特征进行对比；

其中，当该用户的语音特征与服务器中的用户语音特征相匹配后，提取该语音控制命令并基于该语音控制命令进行视频播放的控制。

进一步地，优选的方法是，所述对用户语音进行训练提取语音特征并保存在语音特征库中，具体包括：

计算用户的语音的声学参数，提取出能够反映语音信号特征的关键特征参数并进行降维；

获取用户输入的若干次控制命令的训练语音；

经过预处理和语音特征后，得到特定用户的语音特征矢量参数并存储在网络服务器中的语音特征库中。

进一步地，优选的方法是，所述关键特征参数采用MFCC参数。