专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果2个,建议您升级VIP下载更多相关专利
  • [发明专利]一种语音状态识别方法和装置-CN202310505732.5在审
  • 曾孙禄;何晓冬 - 京东科技信息技术有限公司
  • 2023-05-06 - 2023-07-28 - G10L15/06
  • 本发明公开了一种语音状态识别方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括获取具有状态标签的语音数据,输入第一模型,得到多个特征向量;对多个特征向量进行聚类分析,对相同类别的多个特征向量生成相同的伪标签,得到对应的伪标签序列;将不具有状态标签的语音数据输入至第二模型,以伪标签序列为目标值对第二模型进行训练;从训练好的第二模型中提取语音预训练模型,连接语音预训练模型、池化层和全连接层,得到第三模型,将语音数据输入至第三模型以进行训练;采集语音波形,输入训练好的第三模型,根据输出内容确定输入数据的状态信息。从而,本发明的实施方式能够解决现有语音状态识别模型精度低且效率不理想的技术问题。
  • 一种语音状态识别方法装置
  • [发明专利]一种音频数据处理方法、系统、存储介质及电子设备-CN202310143488.2在审
  • 丁国宏;曾孙禄 - 京东科技信息技术有限公司
  • 2023-02-10 - 2023-05-23 - G10L21/0272
  • 本申请公开了一种音频数据处理方法、系统、存储介质及电子设备,通过预设分帧方式对获取到的音频信号进行分帧得到预设长度的音频序列,通过预设识别模型对音频序列进行识别处理,得到目标语音特征,通过预设声纹分割聚类模型对目标语音特征进行聚类处理,得到声纹分割聚类结果。通过上述方案,从得到的音频序列中抽取出目标语音特征,相比简单的fbank特征,目标语音特征中包含了说话人属性区分信息,因此可以更好实现说话人语音分割的任务,对目标语音特征进行聚类,得到多个说话人的音频中区分出不同说话人所对应的音频片段的结果,提高在多个说话人的业务场景下分辨出语音中每个时间点是谁在说话的识别效果。
  • 一种音频数据处理方法系统存储介质电子设备

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top