[发明专利]一种多媒体播放设置自动调节方法及系统有效
申请号: | 201911152466.2 | 申请日: | 2019-11-22 |
公开(公告)号: | CN111027675B | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 过洁;白晋斌;陈振宇;黄诗涵;胡育玮;郭延文 | 申请(专利权)人: | 南京大学 |
主分类号: | G06N3/048 | 分类号: | G06N3/048;G06N3/047;G06N3/08;G10L25/03;G10L25/24;G10L25/30;G10L25/51 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 冯艳芬 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多媒体 播放 设置 自动 调节 方法 系统 | ||
本发明公开了一种多媒体播放设置自动调节方法及系统,方法包括:当按照预设时间间隔或用户操作录制外界环境音频信息,并发送至服务器端;服务器端从接收到的外界环境音频信息中分别提取左声道和右声道的梅尔倒谱系数和恒定Q色度图两种特征,并将两种特征结合后作为各声道的音频特征;服务器端将音频特征输入训练好的深度神经网络中,得到外界环境音频信息对应的环境预测分类标签,并发送至多媒体端;多媒体端判断接收到的环境预测分类标签是否与当前环境分类一致,若不一致,则从预设的设置表中查找与所述环境分类标签对应的推荐播放设置,并按照查找到的推荐播放设置更新多媒体播放设备。本发明可以自动调节多媒体播放设置,更加智能,且调节方法更精确。
技术领域
本发明涉及智能终端应用,尤其涉及一种多媒体播放设置自动调节方法及系统。
背景技术
技术的进步和人们生活水平的不断提高,使体积小巧、功能丰富的智能手机成为人们生活中必不可少的一部分。智能手机有着极其丰富的APP可以使用,这使得智能手机的应用非常广泛;而其中,音乐播放就是智能手机最为重要的应用之一。而目前,当人们使用智能手机来播放音乐时,常常会遇到需要根据所处的场景来手动调节音量的问题。例如,当一个人用耳机听着音乐从热闹的街道走进一家静谧的书店,他必须手动将播放器的音量调小以让耳朵感到舒适;当他从书店出来回到街道时,又需要手动将音量调高以适应街道上嘈杂的环境。这是一个影响播放体验的令人不便的问题。
近年来,深度学习技术在语音识别、图像识别、自然语言处理等领域取得了巨大成就。目前用于声音识别的常用的机器学习算法为HMM(Hidden Markov Model,隐马尔科夫模型)、GMM(Gaussian Mixture Model,高斯混合模型)、SVM(Support Vector Machine,支持向量机)和KNN(K-Nearest Network,K-近邻网络)。它们都是具有浅层结构的分类器,处理简单问题或者完全约束的问题时有良好的效果。但是当处理复杂的自然信号如环境声音、自然语言时,由于缺少对复杂信号的表达能力和建模能力,这些浅层模型往往不能满足人们对识别性能的要求。深度学习中出现的诸如受限波尔茨曼机、CNN(ConvolutionalNeural Network,卷积神经网络)等技术在图像识别、语音识别领域取得的成功表明了其强大实力。
发明内容
发明目的:本发明针对现有技术存在的问题,提供一种多媒体播放设置自动调节方法及系统,在调节时中采用深度神经网络预测外界环境,从而可以根据外界环境自动调节多媒体播放的设置,以适应当前外界环境,更加智能人性化,且调节结果更精确。
技术方案:本发明所述的多媒体播放设置自动调节方法包括:
当用户将多媒体端设置为自动识别场景变化时,多媒体端实时监测外界环境声音,按照预设时间间隔录制外界环境音频信息,并发送至服务器端;
当用户将多媒体端设置为自主录制时,在用户的自主操作下录制外界环境音频信息,并发送至服务器端;
服务器端从接收到的外界环境音频信息中分别提取左声道和右声道的梅尔倒谱系数和恒定Q色度图两种特征,并将两种特征结合后作为各声道的音频特征;
服务器端将左声道和右声道的音频特征输入训练好的深度神经网络中,得到外界环境音频信息对应的环境预测分类标签,并发送至多媒体端;
多媒体端判断接收到的环境预测分类标签是否与当前环境分类一致,若不一致,则从预设的环境分类与推荐播放设置表中查找与所述环境分类标签对应的推荐播放设置,并按照查找到的推荐播放设置更新多媒体播放设备。
进一步的,所述深度神经网络的训练过程为:
获取多种外界环境的多个音频信息;
从外界环境音频信息中提取左声道和右声道的梅尔倒谱系数和恒定Q色度图,并将两者结合后作为各声道的音频特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911152466.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种流水线式干洗设备
- 下一篇:一种微生物自修复混凝土裂缝修复情况观测方法