[发明专利]基于多模态识别的在线人才筛选方法在审
申请号: | 202011484333.8 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112508530A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 巨琰 | 申请(专利权)人: | 无锡爱视智能科技有限责任公司 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06Q10/06;G06K9/00;G06N3/04;G06N3/08;G10L25/51;G10L25/30 |
代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 余莹 |
地址: | 214000 江苏省无*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多模态 识别 在线 人才 筛选 方法 | ||
1.基于多模态识别的在线人才筛选方法,其特征在于,包括以下步骤:
S1:根据面试者提交的自我介绍和指定问题回答的短视频,提取短视频中的音频数据和视频数据;
S2:对所述步骤S1获得的音频数据进行平滑去噪的预处理,对所述预处理后的音频数据提取34类音频特征FA∈{RN×34},并对所述34类音频特征FA进行归一化处理,构建体现面试者语言表达能力的音频联合特征数据F′A∈{RN×34};
S3:利用非正交主偏度分析特征选择算法对所述S2步骤得到的音频联合特征数据进行特征降维,得到降维后的特征矩阵Y,所述Y为基于音频联合特征;
S4:训练所述基于音频联合特征Y的SVM语言表达能力预测模型;
S5:利用基于YOLO v4训练的头肩检测器对所述步骤S1获得的视频数据中固定帧的头肩区域图像进行裁剪,并对其进行归一化处理,获得多张形象分值图像数据;
S6:利用所述S4步骤得到的归一化后的所述形象分值图像数据训练形象分值预测模型,所述训练基于SSR-Net算法;
S7:利用所述S6步骤得到的形象分值预测模型对所述S1步骤得到的所述短视频的视频进行多帧预测结果求平均人工评分,利用所述S4步骤得到的语言表达能力评分预测模型对所述短视频的音频进行预测求平均人工评分,将两种模型的结果求和则为最终的综合得分。
2.根据权利要求1所述的基于多模态识别的在线人才筛选方法,其特征在于,所述S2步骤为了减少背景噪声的影响,对所述步骤S1获得的音频数据采用均值平滑滤波,得到与处理后的音频数据。
3.根据权利要求1所述的基于多模态识别的在线人才筛选方法,其特征在于,所述S2步骤中用采样频率fs=16000Hz,计算窗口win=0.05,计算步长step=0.05提取34类音频特征FA∈{RN×34}。,所述34类音频特征包括:短时平均过零率、能量、能量熵、频谱一阶距、频谱延展度、谱熵、频谱通量、频谱滚降点、梅尔倒谱系数、12级音阶、12级音阶的标准方差。
4.根据权利要求1所述的基于多模态识别的在线人才筛选方法,其特征在于,所述S2步骤对所述34类音频特征FA∈{RN×34}进行归一化处理时,对34类音频特征分别做z-score的标准化处理,对标准化的特征进行联合,构建体现面试者语言表达能力的音频联合特征数据F′A∈{RN×34}。
5.根据权利要求1所述的基于多模态识别的在线人才筛选方法,其特征在于,为消除音频联合特征之间的冗余信息,并挖掘特征之间的高维信息,采用非正交主偏度分析进行特征降维处理,得到前k个主偏度u的特征转换矩阵U=[u1,...,uk],根据特征转换矩阵U,可以得到降维后的特征矩阵Y=F'AU。
6.根据权利要求1所述的基于多模态识别的在线人才筛选方法,其特征在于,所述S5步骤包括以下步骤:
S51:训练所述基于YOLO v4训练的头肩检测器,限定所述头肩检测器的目标框位置的标定按照矩形框包含所述固定帧的头肩区域图像中头部到胸部以上区域;
S52:对所述S41步骤获得的包括头部到胸部以上区域的头肩区域图像进行112×112归一化处理;
S53:设定2秒采集一次图像,每个视频采集t次,N组视频共采集N*t张形象分值图像数据。
7.根据权利要求1所述的基于多模态识别的在线人才筛选方法,其特征在于,所述S7步骤中,所述形象分值预测模型评分满分总分为50分,所述语言表达能力评分预测模型评分满分总分为50分。
8.根据权利要求1所述的基于多模态识别的在线人才筛选方法,其特征在于,所述形象分值预测模型的评分指标为面容整洁度、精神面貌或着装中的一种或几种;所述语言表达能力评分预测模型评分指标为语言表达。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡爱视智能科技有限责任公司,未经无锡爱视智能科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011484333.8/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理