[发明专利]基于语音的性别识别方法及其装置、存储介质和设备在审

申请号：	201911147316.2	申请日：	2019-11-21
公开（公告）号：	CN110827800A	公开（公告）日：	2020-02-21
发明（设计）人：	周瑞	申请（专利权）人：	北京智乐瑟维科技有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L15/08;G10L15/26;G10L17/22
代理公司：	北京科家知识产权代理事务所(普通合伙) 11427	代理人：	陈娟
地址：	100036 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于语音性别识别方法及其装置存储介质设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开涉及一种基于语音的性别识别方法及其装置、存储介质和设备，包括：获取讲话者发声的待识别的语音文件；提取所述语音文件中数据点的特征数据，所述特征数据为能够识别所述讲话者性别的数据；根据所述特征数据并通过SVM支持向量机分类模型对所述讲话者的性别进行识别，并输出识别结果，以便于判断出讲话者的性别，该方法操作简单，便于实现，且准确率高，可广泛应用于基于语音的人机交互领域中。

技术领域

本公开涉及语音处理技术领域，具体地，涉及一种基于语音的性别识别方法及其装置、存储介质和设备。

背景技术

在人机交互领域中，对于依赖语音交互的智能机器人应用而言，语音可以提供直接可靠的交互方式。但是在交互过程中，机器人也需要像人一样，通过语音判断出对话者的性别，以便给予更切合语境的答复。因此，在基于语音人机交互领域中，通过语音识别出对话人的性别就具有重要的实际意义。通过语音识别出对话者的性别，对语音内容和语种不作限制，故语音性别识别可以被广泛应用。

发明内容

本公开的目的是提供一种基于语音的性别识别方法及其装置、存储介质和设备。

为了实现上述目的，在本公开实施例的第一方面提供一种基于语音的性别识别方法，包括：获取讲话者发声的待识别的语音文件；提取所述语音文件中数据点的特征数据，所述特征数据为能够识别所述讲话者性别的数据；根据所述特征数据并通过SVM支持向量机分类模型对所述讲话者的性别进行识别，并输出识别结果

可选地，所述SVM分类模型包括：

其中，x_i为需要进行性别识别的语音文件内的数据点，x为已知性别的数据点，<x_i,x>表示x_i和x两者之间的内积，α_i表示SVM分类模型中超平面的支持向量，y_i表示语音文件中数据点的特征数据，b表示SVM分类模型中超平面的截距；

其中，α_i由下述关系式确定：

其中，<φ(x_i),φ(x_j)>表示SVM分类模型中语音文件中的数据点到特征空间的映射。

可选地，所述SVM分类模型包括：

所述SVM分类模型由SVM分类算法经过训练得到。

在本公开实施例的第二方面提供一种基于语音的性别识别装置，包括：

获取模块，用于获取讲话者发声的待识别的语音文件；

特征数据提取模块，用于提取所述语音文件中数据点的特征数据，所述特征数据为能够识别所述讲话者性别的数据；