[发明专利]语音拾取装置及多媒体设备有效
申请号: | 201710423629.0 | 申请日: | 2017-06-07 |
公开(公告)号: | CN107123423B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 于豪 | 申请(专利权)人: | 微鲸科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/20;G06K9/00 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 苏胜 |
地址: | 201210 上海市浦东*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 拾取 装置 多媒体设备 | ||
1.一种语音拾取装置,其特征在于,所述装置包括:
用于采集图像的图像采集单元;
与所述图像采集单元电性连接,用于对图像采集单元采集到的图像进行人脸识别的人脸识别单元;
用于采集语音信号的语音采集单元;
与所述语音采集单元连接,用于调整所述语音采集单元朝向的转向调整单元;及
与所述图像采集单元、人脸识别单元、语音采集单元、转向调整单元电性连接的处理控制单元;
所述处理控制单元在所述人脸识别单元识别到所述图像采集单元采集的图像中存在人脸时,控制所述转向调整单元的运行以使所述语音采集单元对准图像中人脸所在的方位,并控制所述语音采集单元对人脸所在方位的语音信号进行采集;
所述处理控制单元具体用于在所述人脸识别单元识别到所述图像采集单元采集的图像中存在人脸时,对识别到的人脸的面部信息进行处理,得到所述人脸中嘴部对应的方位,并根据所述嘴部对应的方位控制所述转向调整单元,使所述语音采集单元对准所述嘴部对应的方位进行语音信号的采集;
所述处理控制单元在所述人脸识别单元识别到的人脸的数目为多个时,获得各个人脸对应的控制权限,控制所述转向调整单元带动所述语音采集单元朝向控制权限最高的人脸所在的方位,以对所述人脸所在方位的语音信号进行采集。
2.根据权利要求1所述的装置,其特征在于,所述装置还包括用于对所述装置周边环境中的噪声信号进行采集的噪声采集单元;
所述处理控制单元与所述噪声采集单元电性连接,以根据所述噪声采集单元采集到的噪声信号对所述语音采集单元采集到的语音信号进行除噪处理,得到除噪后的语音信息。
3.根据权利要求2所述的装置,其特征在于,所述装置还包括用于进行数据交互的网络通信单元;
所述网络通信单元与所述处理控制单元电性连接,所述装置通过所述网络通信单元与服务器通信连接,以将所述处理控制单元得到的除噪后的语音信息发送给所述服务器进行语音识别,或接收服务器对除噪后的语音信息进行语音识别后得到的控制指令。
4.根据权利要求2所述的装置,其特征在于,所述装置还包括用于进行语音识别的语音识别单元;
所述语音识别单元与所述处理控制单元电性连接,以对所述处理控制单元得到的除噪后的语音信息进行语音识别,得到对应的控制指令。
5.根据权利要求2所述的装置,其特征在于,所述语音采集单元包括至少一个语音取样传声器,所述噪声采集单元包括至少一个噪声取样传声器,至少一个所述语音取样传声器配合至少一个所述噪声取样传声器形成一传声器阵列,以分别对人脸所在方位的语音信号和所述语音拾取装置周边环境中的噪声信号进行采集。
6.根据权利要求2所述的装置,其特征在于,所述处理控制单元包括音频处理子单元;
所述音频处理子单元用于对所述噪声采集单元采集到的噪声信号和所述语音采集单元采集到的语音信号进行放大处理后,并将放大后的噪声信号进行反相处理后与放大后的语音信号进行混合叠加,以消除所述语音信号中的噪声信号,得到除噪后的语音信息。
7.根据权利要求1所述的装置,其特征在于,所述装置还包括与所述图像采集单元连接,用于控制所述图像采集单元的图像采集方向的转动控制单元。
8.一种多媒体设备,其特征在于,所述多媒体设备包括权利要求1-7中任意一项所述的语音拾取装置,所述多媒体设备对所述语音拾取装置采集到的语音信号进行语音识别,得到与所述语音信号匹配的控制指令,并根据所述控制指令执行相应的操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微鲸科技有限公司,未经微鲸科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710423629.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:无人机定位语音分布式控制方法
- 下一篇:音频文件处理方法及装置