“凌震华”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果67个，建议您升级VIP下载更多相关专利

[发明专利]一种长帧移语音相位谱预测方法及装置-CN202310737506.X在审
发明人：艾杨;鲁叶欣;凌震华 -专利权人：中国科学技术大学
申请日： 2023-06-19 - 公布日： 2023-09-05 - 主分类号： G10L19/04 文献下载
摘要：本发明提供一种长帧移语音相位谱预测方法及装置，涉及语音信号处理技术领域，该方法包括：基于无损插值技术，将长帧移语音对数幅度谱转换为短帧移语音对数幅度谱；使用短帧移语音对数幅度谱进行相位谱预测，得到短帧移语音相位谱；根据短帧移语音相位谱，生成长帧移语音相位谱。本发明能够提高长帧移语音相位谱的预测结果准确度。
一种长帧移语音相位预测方法装置

[发明专利]一种声码器的构建方法、语音合成方法及相关装置-CN202310081092.X在审
发明人：艾杨;凌震华 -专利权人：中国科学技术大学
申请日： 2023-01-16 - 公布日： 2023-08-01 - 主分类号： G10L13/02 文献下载
摘要：本申请实施例公开了一种声码器的构建方法、语音合成方法及相关装置，先获取目标声学特征，并将目标声学特征分别输入到幅度谱预测模型和相位谱预测模型中得到第一对数幅度谱和第一相位谱，第一对数幅度谱包括第一幅度谱。接着根据第一幅度谱和第一相位谱进行计算得到第一重构短时谱，并对第一重构短时谱预处理得到第一重构语音波形。计算幅度谱损失、相位谱损失、短时谱损失、波形损失，并根据以上损失计算修正参数。再根据修正参数修正幅度谱预测模型和相位谱预测模型得到幅度谱预测器和相位谱预测器。本申请的幅度谱预测器和相位谱预测器可以实现平行直接预测幅度谱和相位谱，提高了语音生成的效率，降低了整体运算的复杂度。
一种声码构建方法语音合成相关装置

[发明专利]语音增强方法及装置-CN202310573048.0在审
发明人：鲁叶欣;艾杨;凌震华 -专利权人：中国科学技术大学
申请日： 2023-05-17 - 公布日： 2023-07-04 - 主分类号： G10L21/0208 文献下载
摘要：本申请公开了一种语音增强方法及装置，通过获取带噪语音波形的带噪相位谱及带噪幅度谱，利用预设的语音增强模型处理带噪相位谱及带噪幅度谱，得到增强相位谱及增强幅度谱，根据增强相位谱及增强幅度谱计算得到增强语音波形，语音增强模型被配置为基于带噪相位谱及带噪幅度谱预测增强伪实部谱及增强伪虚部谱，预测增强幅度谱，基于预设的模拟相位计算公式对增强伪实部谱及增强伪虚部谱进行计算，得到值域区间限制在主值区间内的增强相位谱的内部状态表示，避免了由于相位的卷绕特性导致无法预测得到增强相位谱的问题，使得根据增强相位谱及增强幅度谱计算得到的增强语音波形质量高、信噪比高，极大地改善了对带噪语音波形的增强效果。
语音增强方法装置

[发明专利]一种图形评估方法、装置、设备及存储介质-CN201910677037.0有效
发明人：徐飞扬;丁悦;李云霞;李鑫;凌震华 -专利权人：科大讯飞股份有限公司
申请日： 2019-07-25 - 公布日： 2023-05-30 - 主分类号： G06T1/00 文献下载
摘要：本申请提供了一种图形评估方法、装置、设备及存储介质，其中，方法包括：获取目标对象根据绘制要求绘制目标图形时的轨迹点数据，其中，目标图形包括至少一种图形元素；根据轨迹点数据，获取目标图形的评估指标集合，其中，评估指标集合包括至少一个评估指标，一个评估指标为目标图形的一个特征，目标图形的特征包括笔画层面的特征、图形元素层面的特征和/或整个图形层面的特征；根据评估指标集合，确定目标图形的评估结果。本申请提供的图形评估方法能够自动、准确、高效地对目标对象根据绘制要求绘制的目标图形进行评估。
一种图形评估方法装置设备存储介质

[发明专利]一种卷积类神经网络计算结构及应用方法-CN202211441148.X在审
发明人：张海俊;汪锦想;于振华;丁杰;凌震华 -专利权人：中国科学技术大学
申请日： 2022-11-17 - 公布日： 2023-05-02 - 主分类号： G06N3/063 文献下载
摘要：本申请提供了一种卷积神经网络结构及应用方法，所述计算结构包括至少N层卷积层，所述N层卷积层依次相连；所述N个卷积层包括第一卷积层和计算卷积层，所述第一卷积层用于对所述输入层的输入数据集进行卷积计算，所述计算卷积层包括N‑1个卷积层，所述计算卷积层用于对当前卷积层连接的上一个卷积层的计算结果和次层历史数据进行卷积计算；通过调整卷积和池化层的位置，在最开始的输入数据上末尾添加若干可学习的数据参数，保证最后的数据输出维度符合预期，如此，通过对一般的卷积类神经网络模型的计算结构进行调整，来保证流式推理过程中，各计算阶段计算图逻辑一致。
一种卷积神经网络计算结构应用方法

[发明专利]一种模型计算方法、装置及设备-CN202211669086.8在审
发明人：张海俊;姚文军;汪锦想;魏岩;凌震华 -专利权人：中国科学技术大学
申请日： 2022-12-23 - 公布日： 2023-04-14 - 主分类号： G06N3/063 文献下载
摘要：本申请公开了一种模型计算方法、装置及设备，能够应用于神经网络模型的加速计算，将神经网络模型的计算图进行节点拆分，获取单一节点；识别单一节点并确认可融合节点；将多个可融合节点融合生成融合节点；将融合节点替代多个可融合节点，并通过融合节点实现神经网络模型的计算。采用本申请提供的技术方案，能够大大提高神经网络模型的计算速度，并大量提高CPU效能，实现神经网络模型的高效计算。
一种模型计算方法装置设备

[发明专利]认知障碍预测方法及电子设备、存储装置-CN202010774495.9有效
发明人：徐飞扬;张弢;李鑫;凌震华 -专利权人：科大讯飞股份有限公司
申请日： 2020-08-04 - 公布日： 2023-04-04 - 主分类号： G10L25/66 文献下载
摘要：本申请公开了一种认知障碍预测方法及电子设备、存储装置，其中，认知障碍预测方法包括：获取测试对象回答预设问题的语音数据；利用初始识别模型识别语音数据，得到初始文本；利用语音数据和初始文本进行初始预测，得到测试对象是否存在认知障碍的初始预测结果；基于初始预测结果，选择第一识别模型、第二识别模型中至少一者识别语音数据，得到最终文本；利用语音数据和最终文本进行最终预测，得到测试对象是否存在认知障碍的最终预测结果。上述方案，能够提高认知障碍预测的精度。
认知障碍预测方法电子设备存储装置

[发明专利]基于韵律发音解耦的元学习多语种语音合成模型及方法-CN202211491405.0在审
发明人：彭宇坤;凌震华 -专利权人：中国科学技术大学
申请日： 2022-11-25 - 公布日： 2023-03-31 - 主分类号： G10L13/02 文献下载
摘要：本发明公开一种基于韵律发音解耦的元学习多语种语音合成模型及方法，属语音合成领域，该模型包括：由发音编码器、发音流参数生成器和发音解码器组成的发音流声学子模型；由韵律编码器、韵律流参数生成器和韵律解码器组成的韵律流声学子模型；预处理网络的输入前一帧的声学特征，输出连接注意力模块；注意力模块能将输入的发音编码器的输出和韵律编码器的输出拼接后形成上下文向量，并分别输出至发音解码器和韵律解码器，发音解码器能根据输入的上下文发音向量预测输出梅尔倒谱和停止标志；韵律解码器能根据输入的上下文韵律向量预测输出能量、基频和清浊音标志。该模型及方法，能对发音和韵律分别建模，有效提高多语言语音合成的可懂度和自然度。
基于韵律发音学习语种语音合成模型方法

[发明专利]定长输入神经网络模型的修改方法、装置及设备-CN202211555192.3在审
发明人：姚文军;蒋竞;凌震华 -专利权人：中国科学技术大学
申请日： 2022-12-06 - 公布日： 2023-03-31 - 主分类号： G06N3/08 文献下载
摘要：本发明涉及一种定长输入神经网络模型的修改方法、装置及设备，该方法包括：获取仅支持定长输入的神经网络模型的原图后，获取神经网络模型的各算子的包括mask变换子图和mask清零子图的mask处理子图；然后，生成包含该各算子的mask处理子图的数据清零图；在接收到用户输入的mask数据集后，根据数据清零图中的mask变换子图对mask数据集中的mask进行变换操作，并将原图中需要进行数据清零的算子替换为该算子的mask清零子图，以实现数据清零图和原图的合并；最后，根据合并后的图生成用于计算与mask对应的变长输入数据的目标神经网络模型。基于此，本申请提高了mask和数据清零操作的添加效率和准确率，进而，本申请能够提高神经网络模型的修改效率和准确率。
定长输入神经网络模型修改方法装置设备

[发明专利]利用抗卷绕损失训练的平行估计架构网络预测相位的方法-CN202211489291.6在审
发明人：艾杨;凌震华 -专利权人：中国科学技术大学
申请日： 2022-11-25 - 公布日： 2023-03-28 - 主分类号： G10L25/30 文献下载
摘要：本申请提供一种利用抗卷绕损失训练的平行估计架构网络预测相位的方法，方法包括，在训练过程中，通过待训练的神经网络中平行的两个线性卷积层，以及相位计算单元，模拟由短时复数谱的实虚部计算相位谱的过程，并将预测的相位值限制在主值区间内，实现卷绕相位谱的预测，并且训练所用的抗卷绕损失包含通过抗卷绕函数激活的瞬时相位误差、群延时误差和瞬时角频率误差，避免相位卷绕造成的误差扩大问题。训练结束后再用训练好的相位预测神经网络处理待预测语音信号的对数幅度谱，获得卷绕相位谱。本方案通过神经网络直接预测语音信号的卷绕相位谱，并通过计算损失时引入抗卷绕函数解决训练时相位卷绕造成的误差扩大问题，具有较高的效率和准确度。
利用卷绕损失训练平行估计架构网络预测相位方法

[发明专利]一种四层负载均衡的数据处理方法及相关装置-CN202211446329.1在审
发明人：张致江;张浩;凌震华 -专利权人：中国科学技术大学
申请日： 2022-11-18 - 公布日： 2023-03-07 - 主分类号： H04L67/1004 文献下载
摘要：本申请公开了一种四层负载均衡的数据处理方法及相关装置，可用于计算机技术领域。该方法中，首先，接收访问端发送的数据包，然后，基于数据包携带的信息从多个网卡接收队列中确定用于接收数据包的第一网卡接收队列；接着，通过第一网卡接收队列以及预先建立的用户态轻量级IP协议栈，向多个IP虚拟服务器IPVS中与第一网卡接收队列对应的第一IPVS转发所述数据包；继而，基于IPVS中的负载均衡策略，确定多个真实服务器中与数据包对应的目的真实服务器；最后，向目的真实服务器转发数据包。由此，本申请实施例使用用户态轻量级IP协议栈处理数据包，缩短了数据包处理流程，减少了CPU性能消耗，提高了负载均衡设备的抗负载能力。
一种负载均衡数据处理方法相关装置

[发明专利]一种目标语言模型确定方法及装置-CN202211312278.3在审
发明人：刘迪源;张磊;张滔;吴国兵;朱成志;张海俊;凌震华 -专利权人：中国科学技术大学
申请日： 2022-10-25 - 公布日： 2023-03-03 - 主分类号： G10L15/18 文献下载
摘要：本申请公开了一种目标语言模型确定方法及装置，具体的，在用户发起语音识别请求时，利用多种应用场景下多种不同类型的先验信息，对多种应用场景中所对应的语言模型进行赋权，以获得所述多个不同语言模型分别对应的权重。将所述多个不同的语言模型的权重进行比较，获得至少两个权重最大的语言模型，并对其进行语言分计算，将语言分最高的语言模型确定为目标语言模型。通过此方法，在用户发起语音识别请求时，能够在不同的应用场景下，利用多类先验信息自动去选择正确的语言模型以获得准确的语音识别结果，使得不同场景下的语音识别结果更为准确，不再需要手动切换应用场景来使用不同的语言模型，保障了驾驶员的行车安全。
一种目标语言模型确定方法装置

[发明专利]一种数据组装方法、装置、设备和可读存储介质-CN202211488311.8在审
发明人：姚文军;陈旭;凌震华 -专利权人：中国科学技术大学
申请日： 2022-11-25 - 公布日： 2023-02-28 - 主分类号： G06T3/40 文献下载
摘要：本发明提供了一种数据组装方法、装置、设备和可读存储介质，可以获取待输入至模型的所有图片的尺寸集合，其中尺寸集合包括每个图片的尺寸值组。基于每个图片的尺寸值组以及预设拼接规则对所有图片进行拼接，得到一张包含所有图片的拼接图片。然后基于模型的视野宽度在拼接图片中的相邻图片之间插入空白像素，得到组装后的图片。该数据组装方法通过将各个图片拼接为一个大的图片后进行空白像素的填充得到的组装图片，能够加大模型每次计算的样本数，同时减少数据组装过程中所产生的计算浪费，从而提高了神经网络模型的计算效率。
一种数据组装方法装置设备可读存储介质

[发明专利]一种对象存储跨集群海量数据迁移方法及系统-CN202110654199.X有效
发明人：张致江;凌震华;王智国;王芝斌 -专利权人：中国科学技术大学
申请日： 2021-06-11 - 公布日： 2022-12-30 - 主分类号： G06F9/455 文献下载
摘要：本发明公开一种对象存储跨集群海量数据迁移方法及系统，方法包括：步S1，接收用户发出的迁移任务请求和建立的子任务；步S2，根据建立子任务的相关信息，生成迁移任务的对应配置文件，并将建立的子任务和迁移任务的对应配置文件相关信息以OSS对象存储至后端数据库的任务队列中；步S3，按预定时长扫描后端数据库中已存储的任务队列，将处于正在等待状态和暂停状态的迁移任务调度起并执行；步S4，被调起的迁移任务以Docker容器、K8S的job、进程中的任一种方式运行；步S5，根据迁移任务的类型启动对应类型的迁移插件进行迁移操作；步S6，所调用的对应迁移插件采用多级任务的方式完成数据迁移。该方法能实现弹性的跨集群的海量数据的迁移。
一种对象存储集群海量数据迁移方法系统

[发明专利]一种双层自回归解码的序列到序列语音合成方法及系统-CN202010672991.3有效
发明人：周骁;凌震华;戴礼荣 -专利权人：中国科学技术大学
申请日： 2020-07-14 - 公布日： 2022-12-30 - 主分类号： G10L13/047 文献下载
摘要：本发明提出一种双层自回归解码的序列到序列语音合成方法及系统，系统包括编码器和解码器，所述解码器包括：音素级表征模块、音素级预测模块、帧级预测模块；所述编码器将音素名、音调和韵律短语边界信息用向量表征，然后使用卷积神经网络和双向长短时记忆网络将这些信息编码融合得到句子中每个音素的上下文单元表征；所述音素级表征模块，通过帧一级的长短时记忆网络(LSTM)和池化处理获得每个音素单元的声学单元表征；所述音素级预测模块，采用音素级自回归结构来预测当前音素的声学单元表征并建立连续音素之间的依赖关系；所述帧级预测模块，通过解码器LSTM来预测帧级的声学特征。
一种双层回归解码序列语音合成方法系统

1
2
3
4
5
下一页»
尾页
共 67 条