专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果67个,建议您升级VIP下载更多相关专利
  • [发明专利]一种声码器的构建方法、语音合成方法及相关装置-CN202310081092.X在审
  • 艾杨;凌震华 - 中国科学技术大学
  • 2023-01-16 - 2023-08-01 - G10L13/02
  • 本申请实施例公开了一种声码器的构建方法、语音合成方法及相关装置,先获取目标声学特征,并将目标声学特征分别输入到幅度谱预测模型和相位谱预测模型中得到第一对数幅度谱和第一相位谱,第一对数幅度谱包括第一幅度谱。接着根据第一幅度谱和第一相位谱进行计算得到第一重构短时谱,并对第一重构短时谱预处理得到第一重构语音波形。计算幅度谱损失、相位谱损失、短时谱损失、波形损失,并根据以上损失计算修正参数。再根据修正参数修正幅度谱预测模型和相位谱预测模型得到幅度谱预测器和相位谱预测器。本申请的幅度谱预测器和相位谱预测器可以实现平行直接预测幅度谱和相位谱,提高了语音生成的效率,降低了整体运算的复杂度。
  • 一种声码构建方法语音合成相关装置
  • [发明专利]语音增强方法及装置-CN202310573048.0在审
  • 鲁叶欣;艾杨;凌震华 - 中国科学技术大学
  • 2023-05-17 - 2023-07-04 - G10L21/0208
  • 本申请公开了一种语音增强方法及装置,通过获取带噪语音波形的带噪相位谱及带噪幅度谱,利用预设的语音增强模型处理带噪相位谱及带噪幅度谱,得到增强相位谱及增强幅度谱,根据增强相位谱及增强幅度谱计算得到增强语音波形,语音增强模型被配置为基于带噪相位谱及带噪幅度谱预测增强伪实部谱及增强伪虚部谱,预测增强幅度谱,基于预设的模拟相位计算公式对增强伪实部谱及增强伪虚部谱进行计算,得到值域区间限制在主值区间内的增强相位谱的内部状态表示,避免了由于相位的卷绕特性导致无法预测得到增强相位谱的问题,使得根据增强相位谱及增强幅度谱计算得到的增强语音波形质量高、信噪比高,极大地改善了对带噪语音波形的增强效果。
  • 语音增强方法装置
  • [发明专利]一种卷积类神经网络计算结构及应用方法-CN202211441148.X在审
  • 张海俊;汪锦想;于振华;丁杰;凌震华 - 中国科学技术大学
  • 2022-11-17 - 2023-05-02 - G06N3/063
  • 本申请提供了一种卷积神经网络结构及应用方法,所述计算结构包括至少N层卷积层,所述N层卷积层依次相连;所述N个卷积层包括第一卷积层和计算卷积层,所述第一卷积层用于对所述输入层的输入数据集进行卷积计算,所述计算卷积层包括N‑1个卷积层,所述计算卷积层用于对当前卷积层连接的上一个卷积层的计算结果和次层历史数据进行卷积计算;通过调整卷积和池化层的位置,在最开始的输入数据上末尾添加若干可学习的数据参数,保证最后的数据输出维度符合预期,如此,通过对一般的卷积类神经网络模型的计算结构进行调整,来保证流式推理过程中,各计算阶段计算图逻辑一致。
  • 一种卷积神经网络计算结构应用方法
  • [发明专利]基于韵律发音解耦的元学习多语种语音合成模型及方法-CN202211491405.0在审
  • 彭宇坤;凌震华 - 中国科学技术大学
  • 2022-11-25 - 2023-03-31 - G10L13/02
  • 本发明公开一种基于韵律发音解耦的元学习多语种语音合成模型及方法,属语音合成领域,该模型包括:由发音编码器、发音流参数生成器和发音解码器组成的发音流声学子模型;由韵律编码器、韵律流参数生成器和韵律解码器组成的韵律流声学子模型;预处理网络的输入前一帧的声学特征,输出连接注意力模块;注意力模块能将输入的发音编码器的输出和韵律编码器的输出拼接后形成上下文向量,并分别输出至发音解码器和韵律解码器,发音解码器能根据输入的上下文发音向量预测输出梅尔倒谱和停止标志;韵律解码器能根据输入的上下文韵律向量预测输出能量、基频和清浊音标志。该模型及方法,能对发音和韵律分别建模,有效提高多语言语音合成的可懂度和自然度。
  • 基于韵律发音学习语种语音合成模型方法
  • [发明专利]定长输入神经网络模型的修改方法、装置及设备-CN202211555192.3在审
  • 姚文军;蒋竞;凌震华 - 中国科学技术大学
  • 2022-12-06 - 2023-03-31 - G06N3/08
  • 本发明涉及一种定长输入神经网络模型的修改方法、装置及设备,该方法包括:获取仅支持定长输入的神经网络模型的原图后,获取神经网络模型的各算子的包括mask变换子图和mask清零子图的mask处理子图;然后,生成包含该各算子的mask处理子图的数据清零图;在接收到用户输入的mask数据集后,根据数据清零图中的mask变换子图对mask数据集中的mask进行变换操作,并将原图中需要进行数据清零的算子替换为该算子的mask清零子图,以实现数据清零图和原图的合并;最后,根据合并后的图生成用于计算与mask对应的变长输入数据的目标神经网络模型。基于此,本申请提高了mask和数据清零操作的添加效率和准确率,进而,本申请能够提高神经网络模型的修改效率和准确率。
  • 定长输入神经网络模型修改方法装置设备
  • [发明专利]利用抗卷绕损失训练的平行估计架构网络预测相位的方法-CN202211489291.6在审
  • 艾杨;凌震华 - 中国科学技术大学
  • 2022-11-25 - 2023-03-28 - G10L25/30
  • 本申请提供一种利用抗卷绕损失训练的平行估计架构网络预测相位的方法,方法包括,在训练过程中,通过待训练的神经网络中平行的两个线性卷积层,以及相位计算单元,模拟由短时复数谱的实虚部计算相位谱的过程,并将预测的相位值限制在主值区间内,实现卷绕相位谱的预测,并且训练所用的抗卷绕损失包含通过抗卷绕函数激活的瞬时相位误差、群延时误差和瞬时角频率误差,避免相位卷绕造成的误差扩大问题。训练结束后再用训练好的相位预测神经网络处理待预测语音信号的对数幅度谱,获得卷绕相位谱。本方案通过神经网络直接预测语音信号的卷绕相位谱,并通过计算损失时引入抗卷绕函数解决训练时相位卷绕造成的误差扩大问题,具有较高的效率和准确度。
  • 利用卷绕损失训练平行估计架构网络预测相位方法
  • [发明专利]一种四层负载均衡的数据处理方法及相关装置-CN202211446329.1在审
  • 张致江;张浩;凌震华 - 中国科学技术大学
  • 2022-11-18 - 2023-03-07 - H04L67/1004
  • 本申请公开了一种四层负载均衡的数据处理方法及相关装置,可用于计算机技术领域。该方法中,首先,接收访问端发送的数据包,然后,基于数据包携带的信息从多个网卡接收队列中确定用于接收数据包的第一网卡接收队列;接着,通过第一网卡接收队列以及预先建立的用户态轻量级IP协议栈,向多个IP虚拟服务器IPVS中与第一网卡接收队列对应的第一IPVS转发所述数据包;继而,基于IPVS中的负载均衡策略,确定多个真实服务器中与数据包对应的目的真实服务器;最后,向目的真实服务器转发数据包。由此,本申请实施例使用用户态轻量级IP协议栈处理数据包,缩短了数据包处理流程,减少了CPU性能消耗,提高了负载均衡设备的抗负载能力。
  • 一种负载均衡数据处理方法相关装置
  • [发明专利]一种目标语言模型确定方法及装置-CN202211312278.3在审
  • 刘迪源;张磊;张滔;吴国兵;朱成志;张海俊;凌震华 - 中国科学技术大学
  • 2022-10-25 - 2023-03-03 - G10L15/18
  • 本申请公开了一种目标语言模型确定方法及装置,具体的,在用户发起语音识别请求时,利用多种应用场景下多种不同类型的先验信息,对多种应用场景中所对应的语言模型进行赋权,以获得所述多个不同语言模型分别对应的权重。将所述多个不同的语言模型的权重进行比较,获得至少两个权重最大的语言模型,并对其进行语言分计算,将语言分最高的语言模型确定为目标语言模型。通过此方法,在用户发起语音识别请求时,能够在不同的应用场景下,利用多类先验信息自动去选择正确的语言模型以获得准确的语音识别结果,使得不同场景下的语音识别结果更为准确,不再需要手动切换应用场景来使用不同的语言模型,保障了驾驶员的行车安全。
  • 一种目标语言模型确定方法装置
  • [发明专利]一种数据组装方法、装置、设备和可读存储介质-CN202211488311.8在审
  • 姚文军;陈旭;凌震华 - 中国科学技术大学
  • 2022-11-25 - 2023-02-28 - G06T3/40
  • 本发明提供了一种数据组装方法、装置、设备和可读存储介质,可以获取待输入至模型的所有图片的尺寸集合,其中尺寸集合包括每个图片的尺寸值组。基于每个图片的尺寸值组以及预设拼接规则对所有图片进行拼接,得到一张包含所有图片的拼接图片。然后基于模型的视野宽度在拼接图片中的相邻图片之间插入空白像素,得到组装后的图片。该数据组装方法通过将各个图片拼接为一个大的图片后进行空白像素的填充得到的组装图片,能够加大模型每次计算的样本数,同时减少数据组装过程中所产生的计算浪费,从而提高了神经网络模型的计算效率。
  • 一种数据组装方法装置设备可读存储介质
  • [发明专利]一种对象存储跨集群海量数据迁移方法及系统-CN202110654199.X有效
  • 张致江;凌震华;王智国;王芝斌 - 中国科学技术大学
  • 2021-06-11 - 2022-12-30 - G06F9/455
  • 本发明公开一种对象存储跨集群海量数据迁移方法及系统,方法包括:步S1,接收用户发出的迁移任务请求和建立的子任务;步S2,根据建立子任务的相关信息,生成迁移任务的对应配置文件,并将建立的子任务和迁移任务的对应配置文件相关信息以OSS对象存储至后端数据库的任务队列中;步S3,按预定时长扫描后端数据库中已存储的任务队列,将处于正在等待状态和暂停状态的迁移任务调度起并执行;步S4,被调起的迁移任务以Docker容器、K8S的job、进程中的任一种方式运行;步S5,根据迁移任务的类型启动对应类型的迁移插件进行迁移操作;步S6,所调用的对应迁移插件采用多级任务的方式完成数据迁移。该方法能实现弹性的跨集群的海量数据的迁移。
  • 一种对象存储集群海量数据迁移方法系统
  • [发明专利]一种双层自回归解码的序列到序列语音合成方法及系统-CN202010672991.3有效
  • 周骁;凌震华;戴礼荣 - 中国科学技术大学
  • 2020-07-14 - 2022-12-30 - G10L13/047
  • 本发明提出一种双层自回归解码的序列到序列语音合成方法及系统,系统包括编码器和解码器,所述解码器包括:音素级表征模块、音素级预测模块、帧级预测模块;所述编码器将音素名、音调和韵律短语边界信息用向量表征,然后使用卷积神经网络和双向长短时记忆网络将这些信息编码融合得到句子中每个音素的上下文单元表征;所述音素级表征模块,通过帧一级的长短时记忆网络(LSTM)和池化处理获得每个音素单元的声学单元表征;所述音素级预测模块,采用音素级自回归结构来预测当前音素的声学单元表征并建立连续音素之间的依赖关系;所述帧级预测模块,通过解码器LSTM来预测帧级的声学特征。
  • 一种双层回归解码序列语音合成方法系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top