|
钻瓜专利网为您找到相关结果 8个,建议您 升级VIP下载更多相关专利
- [发明专利]一种极短语音语种识别特征提取方法-CN202110755053.4在审
-
刘俊南;郭鹏;江海;魏欣;齐心
-
因诺微科技(天津)有限公司
-
2021-07-02
-
2021-09-10
-
G10L15/00
- 一种极短语音语种识别特征提取方法,所述方法包括步骤:获取输入语音信号;对所述输入语音信号进行预处理;获取基于线性预测系数算法;使用所述基于线性预测系数算法对所述输入语音信号进行特征提取。本申请针对时长1s的极短语音提取语种识别特征进行研究,设计对极短(1s长度)语音语种识别更加鲁棒的特征提取方法,该特征利用频域线性预测系数(FDLP)方法,先使用离散余弦变换(Discrete Cosine Transform,DCT)获得信号的频域等价物,再在频域等价物上利用线性预测(Linear Prediction,LP)分析计算得到语音信号的子带包络信号(Sub‑band Envelop Signal),然后将子带包络信号经过傅里叶变换转化为子带包络的频域信号,然后计算子带包络幅度特征。
- 一种语音语种识别特征提取方法
- [发明专利]一种基于时延神经网络的快速语种识别方法-CN202010245658.4在审
-
刘俊南;江海;王化;刘文龙
-
因诺微科技(天津)有限公司
-
2020-03-31
-
2020-09-11
-
G10L15/00
- 本发明公开了一种基于时延神经网络的快速语种识别方法,步骤1,输入语音信号,对输入的语音信号进行处理,得到固定长度的语音信号帧序列;步骤2、按帧提取语音信号帧序列的底层声学特征;步骤3,将底层声学特征输入Residual TDNN残差块结构中进行计算处理,得到M×64抽象特征;步骤4,进行Attention计算,步骤5,对Attention特征在时间帧维度上应用全局平均池化处理,得到Embedding向量;步骤6,对Embedding向量进行两层DNN提取,得到语种向量;步骤7,将语种向量输入ArcFaceStatic损失函数,将底层声学特征输入到训练好的神经网络,得到所有可识别语种的概率。本发明本发明在短语音上具有较强鲁棒性,因此能够快速准确地识别语种。
- 一种基于神经网络快速语种识别方法
|