专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果15个,建议您升级VIP下载更多相关专利
  • [发明专利]一种语音合成方法及装置-CN202110941865.8有效
  • 张句;贡诚;王宇光;关昊天 - 慧言科技(天津)有限公司
  • 2021-08-17 - 2023-10-20 - G10L13/02
  • 本申请提供一种语音合成方法及装置,涉及音频技术领域,能够提升语音合成的实时率,并且能够提升所合成的语音的音质。该方法包括:基于第一训练样本集和教师声学模型,对预设学生声学模型进行训练,得到目标学生声学模型,该第一训练样本集包括多个文本和该多个文本对应的声学特征,该预设学生声学模型为轻量级的声学模型;并且采用目标学生声学模型对目标文本进行特征提取,得到目标文本的声学特征;以及通过声码器对目标文本的声学特征进行处理,得到目标文本对应的语音。其中,教师声学模型、预设学生声学模型以及目标学生声学模型均用于提取文本的声学特征。
  • 一种语音合成方法装置
  • [发明专利]基于时域单元的声源定位方法、装置及系统-CN202010401597.6有效
  • 关昊天;姜宇;葛檬;廖启波 - 慧言科技(天津)有限公司;深圳市康鸿泰科技有限公司
  • 2020-05-13 - 2023-05-19 - G10L25/51
  • 本发明实施例提供了一种基于时域单元的声源定位方法,应用于远场声音信号的定位,所述方法包括:所述云计算服务器接收所述本地客户端发送的声源定位请求,所述声源定位请求包括触发时刻信息;所述云计算服务器依据所述触发时刻信息生成获取请求,并发送至所述云存储服务器;所述云计算服务器接收所述云存储服务器反馈的对应于所述触发时刻信息的目标频段,所述目标频段对应于触发时刻信息中所述声音信号的能量大于预设阈值的频段;所述云计算服务器依据所述目标频段生成声源定位结果;所述云计算服务器反馈所述声源定位结果至所述本地客户端。通过云计算技术、大数据分析方法和机器学习算法,系统、快速的实现云端定位方法,保证数据安全。
  • 基于时域单元声源定位方法装置系统
  • [发明专利]基于多任务学习的前端文本分析方法-CN202210132522.1有效
  • 黎天宇;张句;关昊天;王宇光 - 慧言科技(天津)有限公司
  • 2022-02-14 - 2023-04-07 - G06F40/289
  • 本发明公开了基于多任务学习的前端文本分析方法,使用相同语料进行特征和结果标注,并使用CNN网络作为共享层对语料进行特征提取,然后分别放入两个Bi‑LSTM中并行训练,针对两个任务输出结果,具体包括以下步骤:S1、数据标注;S2、特征准备;S3、特征融合;S4、分类。本发明使用多任务学习方法将多音字预测和韵律预测任务相结合,实现了一个统一的端到端的文本处理模型,即提供统一的前端结构,以更快速、更轻松地构建高质量的普通话TTS系统。统一模型的训练可以使用相同的数据作为输入,可以直接从原始文本中同时预测多音字和韵律,可以将两个任务并行训练,减少了数据标注的工作量,也节约了训练成本,并同时输出两个结果,简化了训练过程。
  • 基于任务学习前端文本分析方法
  • [发明专利]构建端到端语音评测模型的深度学习方法-CN202210750476.1在审
  • 黎天宇;张句;王宇光;关昊天 - 慧言科技(天津)有限公司
  • 2022-06-29 - 2022-08-05 - G10L15/02
  • 本发明涉及采用神经网络模型的深度学习方法,具体为一种构建端到端语音评测模型的深度学习方法。主要步骤包括构建LSTM+CTC的声学模型,对输入的声音讯号提取特征后进行训练,得到对应单词,然后结合语言模型得到对齐结果,用于后续多维度评测反馈和得分的计算。提取fbank特征用来作语音识别系统的输入和训练声学模型,将提取的特征放入声学模型中进行训练,声学模型使用LSTM+CTC的结构,其中LSTM以特征提取模块提取的特征为输入进行训练学习,得到学习后的特征。使用深度学习技术来实现一种端到端的语音评测方法,使评测过程更加方便,评测结果更加准确。
  • 构建端到端语音评测模型深度学习方法
  • [发明专利]一种语音增强方法及装置-CN202110984082.8在审
  • 张句;王宇光;李志刚;关昊天 - 慧言科技(天津)有限公司
  • 2021-08-25 - 2021-12-10 - G10L21/0208
  • 本申请提供一种语音增强方法及装置,涉及音频技术领域,能够更大程度的降噪,得到质量较高的语音数据。该方法包括:基于语音增强模型,对待处理的语音数据进行处理,预测得到所述待处理语音数据中的纯净语音数据;所述待处理的语音数据为频域语音数据;基于干扰信息提取模型,对所述待处理的语音数据进行处理,预测得到所述待处理语音数据中的纯净干扰数据;基于语音融合模型,对待处理的语音数据、所述待处理语音数据中的纯净语音数据以及所述待处理语音数据中的纯净干扰数据做融合处理,得到增强的语音数据。
  • 一种语音增强方法装置
  • [发明专利]一种远场声音分类方法和装置-CN202010402018.X在审
  • 关昊天;史昊;吕永杰;廖启波 - 慧言科技(天津)有限公司;深圳市康鸿泰科技有限公司
  • 2020-05-13 - 2020-08-14 - G10L15/08
  • 本发明实施例提供了一种远场声音分类方法,包括:利用人工智能模型的自学能力建立远场声音分类关系,其中,人工智能模型的自学能力建立的远场声音分类关系是基于数据增广和多尺度信息的卷积神经网络建立的远场声音分类关系;获取目标区域内的语音信号;基于语音信号的振幅信息对语音信号进行特征提取,得到语谱图;将语谱图输入到利用人工智能模型的自学能力建立的远场声音分类关系中,得到分类结果。将声音分类的音频数据和真实环境下的麦克风接受到的信号分布匹配,去除噪声和混响等干扰因素,使用数据增广的方式来进行声音分类,使得模型在训练数据能够更贴合真实环境的数据分布,从而能够得到更好的鲁棒性,提高声音分类任务的准确率。
  • 一种声音分类方法装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top