[发明专利]使用基于人工神经网络的亚语音单位区分的说话人验证及识别在审
申请号: | 201380069560.6 | 申请日: | 2013-12-05 |
公开(公告)号: | CN104903954A | 公开(公告)日: | 2015-09-09 |
发明(设计)人: | 约翰-保罗·荷索姆;彼得·J·韦尔默朗;乔纳森·肖 | 申请(专利权)人: | 感官公司 |
主分类号: | G10L17/14 | 分类号: | G10L17/14;G10L17/18 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 章蕾 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 基于 人工 神经网络 语音 单位 区分 说话 验证 识别 | ||
1.一种方法,其包括:
由计算机系统存储多个说话人的话音数据,所述话音数据包含多个特征向量及每一特征向量的相关联亚语音类;以及
由所述计算机系统基于所述话音数据,建置人工神经网络ANN以对所述多个说话人中的目标说话人的话音进行建模,所述ANN经配置以区分由所述目标说话人说出的亚语音类的实例与由所述多个说话人中的其他说话人说出的亚语音类的实例。
2.根据权利要求1所述的方法,其中建置所述ANN包括:
检索包括多个现存输出节点的现存ANN,每一现存输出节点对应于亚语音类,且经配置以输出输入到所述现存ANN的特征向量为由所述多个说话人中的所述其他说话人中的一者说出的所述亚语音类的实例的概率;以及
修改所述现存ANN以生成所述ANN,其中所述修改造成所述ANN包含输出层,所述输出层包括所述多个现存输出节点及每一现存输出节点的对应于所述现存输出节点的所述亚语音类的新输出节点,所述新输出节点经配置以输出输入到所述ANN的特征向量为由所述目标说话人说出的所述亚语音类的实例的概率。
3.根据权利要求2所述的方法,其中建置所述ANN进一步包括:
使用源自所述目标说话人的所述话音数据的第一部分训练所述ANN,使得对于所述第一部分中的每一特征向量及相关联亚语音类,对应于所述相关联亚语音类的所述新输出节点经调节以输出相对较高的概率,且对应于所述相关联亚语音类的所述现存输出节点经调节以输出相对较低的概率。
4.根据权利要求3所述的方法,其中建置所述ANN进一步包括:
使用源自所述其他说话人的所述话音数据的第二部分训练所述ANN,使得对于所述第二部分中的每一特征向量及相关联亚语音类,对应于所述相关联亚语音类的所述新输出节点经调节以输出相对较低的概率,且对应于所述相关联亚语音类的所述现存输出节点经调节以输出相对较高的概率。
5.根据权利要求4所述的方法,其中所述ANN进一步包含包括多个输入节点的输入层及包括一或多个隐藏节点的一或多个隐藏层。
6.根据权利要求5所述的方法,其中所述输入层经由具有第一组权重的第一组连接连接到所述一或多个隐藏层中的最低隐藏层,其中所述一或多个隐藏层经由具有第二组权重的第二组连接从较低层连接到较高层,其中所述一或多个隐藏层中的最高隐藏层经由具有第三组权重的第三组连接连接到所述输出层,且其中使用所述话音数据的所述第一部分及所述第二部分训练所述ANN包括应用反向传播算法来修改所述第三组权重而不修改所述第一组权重或所述第二组权重。
7.根据权利要求1所述的方法,其进一步包括:
接收对应于目标短语的发声的声信号;
提取来自所述声信号中的多个帧的特征向量;以及
基于所述特征向量及所述ANN,生成指示由所述目标说话人说出所述目标短语的可能性的说话人验证评分。
8.根据权利要求7所述的方法,其中生成所述说话人验证评分包括使用在词汇方面对所述目标短语进行建模的隐马尔科夫模型HMM执行维特比搜索。
9.根据权利要求8所述的方法,其中在所述多个帧中的每一帧处,所述维特比搜索将对应于所述帧的特征向量作为输入传递到所述ANN,且基于由所述ANN输出的一或多个概率生成每帧的说话人验证评分。
10.根据权利要求9所述的方法,其中所述HMM中的状态的所述每帧的说话人验证评分对应于由所述ANN中的与所述HMM中的所述状态相关联的所述新输出节点输出的所述概率。
11.根据权利要求9所述的方法,其中所述HMM中的状态的所述每帧的说话人验证评分对应于由所述ANN中的与所述HMM中的所述状态相关联的新输出节点输出的所述概率减去由所述ANN中的与所述新输出节点相关联的所述现存输出节点输出的所述概率。
12.根据权利要求9所述的方法,其中生成所述说话人验证评分进一步包括将函数应用于所述每帧的说话人验证评分中的一或多者以计算所述说话人验证评分。
13.根据权利要求12所述的方法,其中所述函数为平均函数或求和函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于感官公司,未经感官公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380069560.6/1.html,转载请声明来源钻瓜专利网。