|
钻瓜专利网为您找到相关结果 685个,建议您 升级VIP下载更多相关专利
- [发明专利]基于TS-VAD的通用语音提取方法-CN202310135769.3在审
-
张海剑;左世玉;张吴胜
-
武汉大学
-
2023-02-13
-
2023-06-06
-
G10L17/02
- 本发明公开了基于TS‑VAD的通用语音提取方法,包括:1)预训练的多尺度编码器对输入的混合录音和参考语音进行特征转换。2)预训练的嵌入提取出目标对象的嵌入向量。3)预训练语音提取网络建立目标语音的掩蔽。4)预训练多尺度语音解码器恢复目标语音波形。5)预训练后,固定预训练网络的多尺度编码器、嵌入向量提取网络和部分语音提取网络,6)微调网络的目标语音检测部分实现TS‑VAD概率向量估计。7)微调网络的目标语音提取部分估计出目标语音向量。8)微调网络二值化TS‑VAD概率向量,并与估计的目标语音向量相乘,得到最终输出语音。本发明在通用语音提取方面具有准确性,鲁棒性,并且在目标对象缺席的情况下能够有效地抑制静音对模型的负面影响。
- 基于tsvad通用语音提取方法
- [发明专利]一种涉案声纹库自动构建的方法和装置-CN202310100660.6在审
-
胡文娟
-
厦门市美亚柏科信息股份有限公司
-
2023-02-07
-
2023-06-02
-
G10L17/02
- 本发明提出了一种涉案声纹库自动构建的方法,包括:语音提取,获取有关人员的电子设备中保存的声音文件并进行提取;语音切割,借助语音识别引擎ASR将提取到的所述语音文件切分为语音片段;计算语音特征,利用梅尔频率倒谱系数MFCC作为声学特征,计算得到语音帧特征矢量并对声纹矢量量化;语音聚类,进行PCA转换进行主成分分析,选择K均值算法对语音进行智能聚类,提取所有相关人员的语音特征;构建声纹库,根据语音聚类的结果,提取聚类后语音文件的声纹特征,建立规范化的标准应用库。通过将涉案人员的声纹信息加入人员信息数据库,后续案件侦破过程中可通过声纹自动识别技术快速锁定犯罪嫌疑人,将侦查范围缩小至极小,极大地提升案件的侦破效率。
- 一种涉案声纹自动构建方法装置
- [发明专利]一种具有声纹识别功能的点读笔系统-CN202310064530.1在审
-
林坚;蒋尚
-
江西合力泰科技有限公司
-
2023-01-30
-
2023-05-16
-
G10L17/02
- 本发明提供了一种具有声纹识别功能的点读笔系统,包括:控制终端、点读笔壳体、控制组件、语音识别组件、文字转换投射组件;控制终端配置为通过执行内部程序实现如下步骤:获取语音识别组件采集到的声音信息,对声音信息进行预处理,生成多个小帧语音信号;对每一小帧语音信号进行特征提取处理,确定方言音种类,生成频谱特征参数;将频谱特征参数与声纹模型数据库中的参数进行相似度匹配,生成识别结果,声纹模型数据库内部存储有多个不同的个人声纹特征参数;根据识别结果将声音信息进行文字转化,生成文字信息,通过控制组件将文字信息投射至文字转换投射组件。此外,现有点读笔系统功能单调,存在视听同步交互障碍,影响教学效率。
- 一种具有声纹识别功能点读笔系统
|