[发明专利]一种基于双麦克风系统检测和定位无声语音指令的方法有效
申请号: | 202011004171.3 | 申请日: | 2020-09-22 |
公开(公告)号: | CN112216304B | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 张国明;徐文渊;冀晓宇 | 申请(专利权)人: | 浙江大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/03;H04S1/00;H04S7/00 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 麦克风 系统 检测 定位 无声 语音 指令 方法 | ||
本发明公开了一种基于双麦克风系统检测和定位无声语音指令的方法。所述方法利用智能设备上的双麦克风系统对“海豚音攻击”进行检测和定位。通过对声音信号进行预处理和特征提取,继而训练二分类机器学习模型,利用训练好的模型进行无声语音指令的检测,这种方法可以有效的识别接收到的语音指令是“无声”的还是正常的指令,进而取消无声指令的识别和执行,然后对攻击者进行定位,从而更快的发现攻击者。
技术领域
本发明涉及人工智能语音助手安全领域,特别是涉及一种基于双麦克风系统检测和定位无声语音指令的方法。
背景技术
目前越来越多的智能设备搭配有诸如Siri,Alexa,Cortana之类的语音助手,它们为人机交互提供了自然且方便的一种交互方式,即可通过语音命令与智能设备进行交互。与此同时语音助手面临的安全问题不容忽视。例如,无声语音命令“海豚音攻击”[Zhang,G.,Yan,C.,Ji,X.,Zhang,T.,Zhang,T.,Xu,W.(2017).DolphinAtack:Inaudible VoiceCommands.arXiv preprint arXiv:1708.09537.]通过注入无声语音命令来激活在线的语音识别系统,实现了对25种搭配有智能语音助手设备的攻击(包括Apple iPhone,GoogleNexus,Amazon Echo,汽车等),“海豚音攻击”可以激活Siri发起FaceTime通话,激活Alexa去购物等,这将带来严重的隐私和其他安全问题。
“海豚音攻击”是利用智能设备的硬件漏洞而发起的一种新型攻击,目前还没有具体可行的防御方案,有报道提出两种防御方案:基于硬件的防御方案和基于机器学习的防御方案。
其中基于硬件的解决方案是建议生产厂商重新设计麦克风电路使得高频声音不能被麦克风接受,或者硬件电路识别到高频的声音后将其滤除。
基于机器学习的防御方案是利用可听声音和不可听声音之间的差异,通过机器学习的方法,区分正常指令和不可听指令。文中[1]利用支持向量机(Support VectorMachine,SVM)成功区分出了正常的声音和不可听的声音指令“Hey”。具体操作如下
第一步:用手机录下5个可听的语音指令‘Hey’作为正样本,然后录下不可听的语音指令“Hey”作为负样本。
第二步:使用这些正负样本训练SVM分类器。
第三步:使用训练好的分类器识别可听与不可听语音指令。
现有技术提出的基于软硬件的防御方案的不足之处在于:
1.厂家是无法对已经出售的智能设备进行硬件上的改进或者说召回成本是厂家无法承受的。
2.麦克风电路能够接受超声波是一直存在的问题,尽管随着技术,工艺的进步和发展,也未能有效的解决,因此基于硬件的防御方案是一种高成本,难度大,周期长的防御方案,不能有效的解决目前存在的问题。
3.现有技术中基于软件的方案只在一台智能设备,测试了一句语音指令“Hey”,因此不能确定该方法能否在不同智能设备,不同语音指令,不同人声的防御效果。
发明内容
本发明的目的是克服已有技术的缺陷,为了解决语音助手容易受到“海豚音攻击”问题,提出基于智能设备上的双麦克风系统检测和定位无声语音指令的方法。
本发明基于双麦克风系统检测和定位无声语音指令的方法,其包括如下步骤:
1)通过双麦克风系统采集左右声道的声音信号;
2)信号预处理
通过端点检测算法将采集到的信号中的静音片段切除;然后对两个声道的语音信号进行归一化处理;
3)特征提取
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011004171.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可调电池封口焊接设备
- 下一篇:一种电力柜内端子线稳定结构