[发明专利]一种声像融合的端对端身份识别方法及装置在审
申请号: | 201911411247.1 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111178287A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 郑大川 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G10L17/00 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 张楠楠 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声像 融合 身份 识别 方法 装置 | ||
本发明公开了一种声像融合的端对端身份识别方法及装置,包括:获取待识别的若干个个体分别录制的预设数目个视频;根据所述若干个个体分别录制的预设数目个视频对所述若干个个体进行注册,以得到注册后的若干个个体信息;获取当前个体录制的当前视频;根据所述当前视频和所述注册后的若干个个体信息,对所述当前个体进行身份识别。通过本发明的技术方案,身份识别准确率高。
技术领域
本发明涉及身份识别技术领域,特别涉及一种声像融合的端对端身份识别方法及装置。
背景技术
随着网络的发展,互联网安全问题日益突出,目前身份识别包括声纹识别和人脸识别;声纹识别,通过麦克风获取用户的一段声音,通过网络提取该语音的特征,通过该特征与用户本身的特征进行对比,进而识别用户的身份;人脸识别,通过摄像头获取待识别用户的人脸图像,通过网络提取该用户的人脸特征,与预存的用户人脸特征进行对比,进行用户身份的识别。单独通过声纹识别技术或人脸识别技术对用户的身份进行识别准确率低。
发明内容
本发明提供一种声像融合的端对端身份识别方法及装置。所述技术方案如下:
根据本发明实施例的第一方面,提供了一种声像融合的端对端身份识别方法,包括:
获取待识别的若干个个体分别录制的预设数目个视频;
根据所述若干个个体分别录制的预设数目个视频对所述若干个个体进行注册,以得到注册后的若干个个体信息;
获取当前个体录制的当前视频;
根据所述当前视频和所述注册后的若干个个体信息,对所述当前个体进行身份识别。
在一个实施例中,还包括:
获取端对端神经网络;
通过所述端对端神经网络对所述当前视频进行计算,以得到活体检测分值及第一特征向量;
判断所述活体检测分值是否大于第一预设阈值,当所述活体检测分值大于所述第一预设阈值时,确定所述当前个体为活体;
当所述活体检测分值小于所述第一预设阈值时,确定所述当前个体为非活体。
在一个实施例中,所述根据所述若干个个体分别录制的预设数目个视频对所述若干个个体进行注册,以得到注册后的若干个个体信息,包括:
通过所述端对端神经网络对所述若干个个体分别录制的预设数目个视频进行计算,以得到所述若干个个体分别录制的预设数目个视频各自对应的特征向量;
对所述若干个个体分别录制的预设数目个视频各自对应的特征向量进行平均处理,以得到所述若干个个体分别对应的最终向量;
将所述若干个个体分别对应的最终向量存储至个体库中,并对所述若干个个体进行编号,以得到若干个个体ID。
在一个实施例中,所述根据所述当前视频和所述注册后的若干个个体信息,对所述当前个体进行身份识别,包括:
将所述第一特征向量与所述个体库中若干个个体分别对应的最终向量进行距离计算,得到若干个距离值;
获取所述若干个距离值中最小的值,及所述若干个距离值中最小的值对应的个体ID;
判断所述若干个距离值中最小的值是否大于第二预设阈值,当所述若干个距离值中最小的值小于所述第二预设阈值时,确定所述当前个体为若干个距离值中最小的值对应的个体,并返回所述若干个距离值中最小的值对应的个体ID;
当所述若干个距离值中最小的值大于所述第二预设阈值时,确定所述当前个体不在所述个体库中。
在一个实施例中,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911411247.1/2.html,转载请声明来源钻瓜专利网。