[发明专利]一种基于语音识别的视频播放控制方法和系统有效
申请号: | 201210025924.8 | 申请日: | 2012-02-07 |
公开(公告)号: | CN102568478A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 吴昊宇;邓龙;姚键;邱丹;潘柏宇;卢述奇;刘睿姝 | 申请(专利权)人: | 合一网络技术(北京)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/06;H04N21/432 |
代理公司: | 北京德和衡律师事务所 11405 | 代理人: | 姚克枫 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语音 识别 视频 播放 控制 方法 系统 | ||
1.一种基于语音识别的视频控制方法,包括:
对用户的语音进行训练提取语音特征并保存在语音特征库中;
接收用户的语音控制命令,与所述保存的用户语音特征进行对比;
其中,当该用户的语音特征与服务器中的用户语音特征相匹配后,提取该语音控制命令并基于该语音控制命令进行视频播放的控制。
2.根据权利要求1所述的基于语音识别的视频控制方法,其特征在于,所述对用户语音进行训练提取语音特征并保存在语音特征库中,具体包括:
计算用户的语音的声学参数,提取出能够反映语音信号特征的关键特征参数并进行降维;
获取用户输入的若干次控制命令的训练语音;
经过预处理和语音特征后,得到特定用户的语音特征矢量参数并存储在网络服务器中的语音特征库中。
3.根据权利要求2所述的基于语音识别的视频控制方法,其特征在于,所述关键特征参数采用MFCC参数。
4.根据权利要求1~3任一所述的基于语音识别的视频控制方法,其特征在于,所述接收用户的语音控制命令,与所述保存的用户语音特征进行对比,具体包括:
将用户后续输入的语音控制命令与语音特征库中存储的中各指令语音特征进行相似性度量,判断用户的语音控制命令是否匹配语音特征库的特征。
5.根据权利要求4所述的基于语音识别的视频控制方法,其特征在于,所述视频控制方法基于FLASH播放器,其中,还包括:
在10秒钟完成对应的用户语音控制命令的识别步骤,在返回成功以后进行相应的视频控制动作。
6.一种基于语音识别的视频控制系统,包括:
语音特征训练单元,用于对用户的语音进行训练提取语音特征并保存在语音特征库中;
语音特征识别单元,用于接收用户的语音控制命令,与所述保存的用户语音特征进行对比;
视频控制单元,用于当该用户的语音特征与服务器中的用户语音特征相匹配后,提取该语音控制命令并基于该语音控制命令进行视频播放的控制。
7.根据权利要求6所述的基于语音识别的视频控制系统,其特征在于,所述语音特征训练单元,具体包括:
特征参数提取子单元,用于计算用户的语音的声学参数,提取出能够反映语音信号特征的关键特征参数并进行降维;
特征参数训练子单元,用于获取用户输入的若干次控制命令的训练语音;经过预处理和语音特征后,得到特定用户的语音特征矢量参数;
发送子单元,用于将上述语音特征矢量参数存储在网络服务器中的语音特征库中。
8.根据权利要求7所述的基于语音识别的视频控制系统,其特征在于,所述关键特征参数采用MFCC参数。
9.根据权利要求6~8任一所述的基于语音识别的视频控制系统,其特征在于,所述语音特征识别单元,具体包括:
对比子单元,用于将用户后续输入的语音控制命令与语音特征库中存储的中各指令语音特征进行相似性度量,判断用户的语音控制命令是否匹配语音特征库的特征。
10.根据权利要求9所述的基于语音识别的视频控制系统,其特征在于,所述视频控制单元,还包括:
FLASH播放器子单元;
播放器控制子单元,用于在10秒钟完成对应的用户语音控制命令的识别,在返回成功以后进行相应的视频控制动作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合一网络技术(北京)有限公司,未经合一网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210025924.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:助动器的控制系统
- 下一篇:基于相关向量机的高精度风电场功率区间预测方法