专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果5个,建议您升级VIP下载更多相关专利
  • [发明专利]一种语音关键词识别中扩增语料的选取方法-CN202010347536.6有效
  • 贺前华;汪星;严海康 - 华南理工大学
  • 2020-04-28 - 2023-02-10 - G10L15/06
  • 本发明公开了一种语音关键词识别中扩增语料的选取方法,步骤包括:对含关键词的原始语音进行语音转化,得到同一语义但不同说话人信息的语音;对原始语音进行语音端点检测去除静音部分,再获取原始语音和生成语音中的关键词片段;将原始语音关键词片段分为男女两类样本,分别训练UBMM、UBMF,用第i个关键词的男女两类原始语音关键词片段分别训练GMM(M,i)、GMM(F,i);采用GMM分离度度量判断GMM分量距离,将分离度较小的设为相似GMM分量,去除GMM(M,i)、GMM(F,i)中相似GMM分量,剩下分离度较大分量形成新的GMM′(M,i)、GMM′(F,i),用GMM′(b,i)、GMM′(g,i)对生成语音关键词片段进行性别分类;采用改进后的评价系数对生成语音进行评价,选取训练样本。本发明能在存在样本较少或不均衡的情况下更高效地训练模型。
  • 一种语音关键词识别扩增语料选取方法
  • [发明专利]一种基于改进动态时间规整算法的语音样本筛选方法-CN201911227134.6有效
  • 贺前华;詹俊瑶;严海康;苏健彬 - 华南理工大学
  • 2019-12-04 - 2022-12-16 - G10L15/06
  • 本发明公开了一种基于改进动态时间规整算法的语音样本筛选方法,包括步骤:使用基于同一文本录制多个语音样本,去除背景音并标注语音样本的元音和辅音,构建样本的语音特征序列表达;根据去除背景音后语音短时帧中元音和辅音的标注类型,通过语音短时帧内信号最大幅值的变化信息来确定过渡音,并对过渡音进行标注;分别对改进DTW算法的局部距离和整体距离进行加权计算,获得两两样本间的距离,构建所有样本的距离矩阵;根据距离矩阵对语音样本进行筛选。本发明解决了在样本数据量大、不能保证样本质量的情况下,对同一文本的语音样本的筛选问题,降低筛选成本,并为后续处理(如语料库的构建、深度神经网络的学习等)提供了更为可靠的样本数据。
  • 一种基于改进动态时间规整算法语音样本筛选方法
  • [发明专利]一种解决关键词识别样本不均衡的方法-CN201910014005.2有效
  • 贺前华;汪星;严海康 - 华南理工大学
  • 2019-01-08 - 2021-03-30 - G10L15/02
  • 本发明公开了一种解决关键词识别样本不均衡的方法,包括1)改变语音基频并保持语音语义不变,利用语音转换技术对含关键词的语音进行转换,获得同一语义样本的不同性别、不同年龄说话人的多个语音样本;2)对神经网络模型中的损失函数做自适应加权处理:使用重量交叉熵时,在每轮训练中分别计算关键词语料和非关键词语料的准确率,根据两者之差自动调节第k轮的加权系数Wk;3)自适应帧数:在使用DNN作为训练模型时根据关键词长度对不同关键词使用不同的检出帧数Li;本发明能有效缓解因数据不平衡或太少造成的训练效果差或无法训练等问题,同时能在一定程度上加快训练速度,提升训练效果。
  • 一种解决关键词识别样本均衡方法
  • [发明专利]一种基于语谱图时间差分的语音音节数估计方法-CN201911331869.3在审
  • 贺前华;苏健彬;严海康;詹俊瑶 - 华南理工大学
  • 2019-12-21 - 2020-04-24 - G10L25/87
  • 本发明提供了一种基于语谱图时间差分的语音音节数估计方法,所述方法步骤包括:将语音信号的语谱图X,通过一个M阶图像后向平滑滤波器得到模糊形式语谱图X*,对其进行N阶时间差分以及M阶图像后向平滑,计算出N阶差分图S;对N阶差分图的每一列进行频率区域选择性求和,以获得初步浊音起始边界统计特征,然后通过该特征以及边界时间间隔限制G1得到初步浊音起始边界;使N阶差分图的低频部分与图案P进行局部图案匹配得到其图案特征图S*,通过图案特征图计算出匹配浊音起始边界;结合初步浊音起始边界和匹配浊音起始边界,通过一个边界时间间隔限制G2,得到最终的浊音起始边界,最后计算出音节数K。本发明具有可解释性,成本低,有着广阔的应用前景。
  • 一种基于语谱图时间差语音音节估计方法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top