[发明专利]基于听觉场景分析的室内环境区域定位系统及方法有效
申请号: | 201810560147.4 | 申请日: | 2018-06-03 |
公开(公告)号: | CN109031202B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 宋浠瑜;王玫;仇洪冰;周陬;昂晨;李凯华 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G01S5/18 | 分类号: | G01S5/18 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 杨雪梅 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 听觉 场景 分析 室内环境 区域 定位 系统 方法 | ||
本发明公开了一种基于听觉场景分析的室内环境区域级定位系统及方法,系统包括通过无线网络连接服务器端和客户端;首先生成室内房间级的定位结果,然后根据该结果,计算该房间内的区域级定位,最终给出准确的区域内定位结果。该定位方法,包括离线阶段建立位置声纹数据库和在线阶段进行声信号的匹配两个步骤。只需要在在线阶段录制所处位置的10s音频,将音频文件转化为位置声纹,上传ABS结果,下载服务器端筛选的房间地图信息,就可以在客户端快速准确的解算出位置信息。由于ABS结果与房间地图信息,都是轻量级的数据,因此,该方法解决了现有室内区域级定位精度低,运算量庞大的问题,同时借助联觉现象,辅以CRP色彩声图呈现方式,提升用户定位体验。
技术领域
本发明涉及室内定位方法,具体是一种基于听觉场景分析(ASA)的室内环境区域定位系统及方法,在人机交互、听觉感知与应用、位置感知与服务等场景中有重要的应用价值。
背景技术
环境声是除语音声和音乐声之外的所有可听声的总称。从信号分析的角度看,环境声信号是非结构化数据,其特性相比语声和乐声要复杂得多,从其中提取有效特征也更加困难。然而,环境声是物理声源自然产生的,具有反映声源特征的复杂声学结构,由于室内环境的物理结构不同,室内布局的不同,室内不同区域的环境声信号具有不同的时频域特性。针对这一难题,结合环境声的特性,我们基于听觉场景分析结论,提出一种室内环境多维声纹的构建方法,用以实现室内区域定位。
常用声信号特征可分为两类:时域特征(如:短时能量、短时平均过零率等)和频域特征(如:MFCC、LPCC等)。己有大量通过环境声信号时频域特征提取与结合,进行声信号识别、建筑物结构监控、室内房间级定位的研究,但是,许多环境声极其相似,因此,利用环境声信号作为位置指纹,实现室内区域定位的精度通常较低。目前,解决这类问题的最佳选择是在定位系统的离线阶段,通过群智感知获取大量环境音频源数据,结合聚类算法,实现区域定位,但引入数据多样性及数据冗余问题,影响了定位系统性能。
发明内容
为了降低室内环境中,环境声信号特征对声纹匹配度的影响,提高室内环境区域定位精度,同时,兼顾定位终端通用性的考虑;并针对同一室内环境中环境声极其相似,导致现有室内环境区域定位方法在复杂室内环境中定位精度差的问题。本发明提出了一种基于听觉场景分析实现室内环境区域定位系统及方法,该方法以通用的智能手机作为环境声感知装置,只需要在定位阶段录制所处位置的10s环境音频,通过离线阶段建立位置声纹数据库和在线阶段进行声信号的匹配两个步骤,实现低时耗、高精度的室内环境区域定位。
本发明基于听觉场景分析的室内环境区域定位系统,包括服务器端和客户端,服务器端与客户端通过无线网络连接;
所述服务器端包括依次连接的智能手机、听觉场景分析模块(ASA)、声学背景谱模块(ABS)、色彩声图模块(CRP);还包括连接听觉场景分析模块(ASA)和色彩声图模块(CRP)的皮尔逊系数提簇模块;通过智能手机的麦克风录制所处位置的10s环境音频输入听觉场景分析模块(ASA),再经声学背景谱模块(ABS)处理,处理ABS的算法为RNN,用来获取房间级的定位结果;
所述客户端包括从服务器端下载并筛选的室内环境地图(包括房间号,区域号,CRP色彩声图)、VAR算法、ASA和ABS、以及测试音频;将测试音频在客户端经ASA和ABS提取测试音频的多维声纹,通过无线网络上传ABS的结果至服务器,由服务器端下载匹配的室内环境地图与VAR算法连接,VAR算法根室内环境地图据解算出多维声纹所处物理位置信息;
所述室内环境区域定位系统,首先生成室内房间级的定位结果,然后根据该结果,计算该房间内的区域级定位,最终给出准确的区域内定位结果。
所述的听觉场景分析模块(ASA)、声学背景谱模块(ABS)、色彩声图模块(CRP)、皮尔逊系数提簇模块为现有技术。
应用上述基于听觉场景分析的室内环境区域定位系统,进行室内环境区域定位的方法,包括离线阶段建立位置声纹数据库和在线阶段进行声信号的匹配两个步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810560147.4/2.html,转载请声明来源钻瓜专利网。