[发明专利]具有语音控制和哼唱检索功能的多媒体播放方法及装置有效
| 申请号: | 201310298771.9 | 申请日: | 2013-07-16 |
| 公开(公告)号: | CN103366784A | 公开(公告)日: | 2013-10-23 |
| 发明(设计)人: | 赵欢 | 申请(专利权)人: | 湖南大学 |
| 主分类号: | G11B27/10 | 分类号: | G11B27/10;G10L15/30 |
| 代理公司: | 湖南兆弘专利事务所 43008 | 代理人: | 赵洪;谭武艺 |
| 地址: | 410082 湖南省长沙*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种具有语音控制和哼唱检索功能的多媒体播放方法及装置,方法步骤如下:用户选择工作模式,采集语音数据并预处理,语音控制模式下,将语音数据与语法规则上传至语音识别服务端进行语音识别,根据识别结果进行播放控制或者资源管理;哼唱检索模式下,将语音数据提取基音序列并转换为音符序列,通过匹配搜索服务端找到与匹配的多媒体资源身份信息,并下载对应的多媒体资源到本地;装置包括人机交互模块、语音输入模块、语音数据处理模块、中央处理器、媒体存储模块、播放解码模块、音频输出模块、网络接口模块、匹配搜索服务端等。本发明具有能够解放用户的双手、用户体验好、使用方便、哼唱检测精确、应用范围广的优点。 | ||
| 搜索关键词: | 具有 语音 控制 哼唱 检索 功能 多媒体 播放 方法 装置 | ||
【主权项】:
一种具有语音控制和哼唱检索功能的多媒体播放方法,其特征在于实施步骤如下:1)用户选择工作模式,采集语音数据并通过专用语音数据处理芯片进行预处理,当用户选择的工作模式为语音控制模式则跳转执行步骤2),如果用户选择的工作模式为哼唱检索模式则跳转执行步骤3);2)将预处理后的语音数据与语法规则上传至互联网上的语音识别服务端进行语音识别,根据语音识别服务端返回的识别结果对本地的多媒体资源进行播放控制或者资源管理;3)将预处理后的语音数据通过专用语音数据处理芯片提取基音序列并转换为音符序列,将所述音符序列发送给互联网上的匹配搜索服务端,通过所述匹配搜索服务端在音符特征数据库中进行匹配搜索找到与音符序列相匹配的多媒体资源身份信息,并根据所述多媒体资源身份信息从互联网下载对应的多媒体资源并存储到本地。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310298771.9/,转载请声明来源钻瓜专利网。
- 上一篇:电力电缆
- 下一篇:语音数据的映射方法和装置





