“党建武”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果99个，建议您升级VIP下载更多相关专利

[发明专利]基于双编解码网络的遥感影像道路提取方法、系统及设备-CN202310929817.6在审
发明人：杨景玉;古宗亮;王阳萍;党建武;王锋;庞阳;岳彪;王文润;任鹏百;雍玖;张希权;李欣 -专利权人：兰州交通大学;甘肃路桥飞宇交通设施有限责任公司
申请日： 2023-07-27 - 公布日： 2023-10-20 - 主分类号： G06V20/10 文献下载
摘要：本发明公开一种基于双编解码网络的遥感影像道路提取方法、系统及设备，涉及道路提取领域。本发明通过获取高分辨率遥感影像并构建双编解码网络，来利用高分辨率遥感影像训练双编解码网络，然后利用训练好的双编解码网络对待提取遥感影像进行道路提取。本发明基于残差U块和解编结合模块构建具有双编解码结构的双编解码网络，通过编码器提取更丰富的局部和全局上下文特征，同时借助解编结合模块联系前后编解码器，充分利用多尺度特征来增强语义信息，从而提高了遥感影像道路提取结果的完整性和准确性。
基于解码网络遥感影像道路提取方法系统设备

[发明专利]一种低资源下利用迁移学习进行情感语音合成的方法-CN202010681019.2有效
发明人：王龙标;徐杰;党建武;贡诚 -专利权人：天津大学
申请日： 2020-07-15 - 公布日： 2023-10-17 - 主分类号： G10L13/02 文献下载
摘要：本发明公开了一种低资源下利用迁移学习进行情感语音合成的方法，包括以下步骤：步骤一，情感向量预训练：利用EMOV‑DB数据集对于一个语音情感识别模型进行训练，这一语音情感识别模型是由风格化端到端语音合成的基本方法GST+Tacotron2模型中风格向量提取部分进一步处理得到的；步骤二，语音合成模型预训练：对于基本的Tacotron2模型，利用LJSpeech‑1.1的数据集进行预训练；步骤三，进行迁移学习训练：对于基本的Tacotron2模型在编码器的结果上连接上步骤一中得到的中间结果，并进行迁移学习训练。本发明采用预训练和迁移学习的方法，能够充分利用单个说话人少量的情感数据，在一个统一的情感语音合成模型的基础上，合成出质量达到一定水平的、情感倾向明显的合成语音。
一种资源利用迁移学习进行情感语音合成方法

[发明专利]一种融合显式和隐式个性化信息的对话生成方法-CN202111051850.0有效
发明人：王瑞芳;贺瑞芳;王龙标;党建武 -专利权人：天津大学
申请日： 2021-09-08 - 公布日： 2023-10-13 - 主分类号： G06F16/332 文献下载
摘要：本发明公开了一种融合显式和隐式个性化信息的对话生成方法，包括如下步骤：1)构建显式个性化信息提取器，利用transformer中的编码器作为上下文编码器对上下文进行编码，再利用个性化‑上下文注意力机制对给定的个性化信息进行编码得到与上下文相关的个性化信息；2)构建隐式个性化信息生成器，利用vMF分布进行抽象和采样得到隐式个性化信息；3)构建个性化信息生成器，利用隐式个性化信息进行生成，用给定的个性化信息对其进行监督，保证隐式个性化信息与上下文和显式个性化信息是相关的；4)构建回复生成器，将上述提到的显式个性化信息，隐式个性化信息以及上下文作为解码器的输入，最终得到对应的回复。提高回复中个性化的一致性，提升回复的多样性。
一种融合个性化信息对话生成方法

[发明专利]一种轨道交通列车控制设备培训系统-CN202211271898.7有效
发明人：雍玖;雷晓妹;魏建国;王阳萍;党建武;路文焕;雍芳;任鹏百 -专利权人：兰州交通大学
申请日： 2022-10-18 - 公布日： 2023-10-10 - 主分类号： G06F3/01 文献下载
摘要：本发明涉及一种轨道交通列车控制设备培训系统，包括：模型构建模块，用于构建各设备的三维立体模型；场景构建模块，用于构建三维全景地图，并与各三维立体模型进行融合，得到三维全景模型；全息互动教学模块，用于基于三维全景模型和各三维立体模型实现互动教学；仿真实验模块，用于基于三维全景模型和各三维立体模型构建仿真实验平台，三维全景模型和各三维立体模型基于控制指令执行相应动作；动态演示模块，用于基于各三维立体模型、各三维立体模型对应的文字描述和演示动画构建动态演示平台。本发明提高了教学模式和时效性，通过增加仿真实验加强对知识点的掌握。
一种轨道交通列车控制设备培训系统

[发明专利]复杂场景下端到端的AR辅助装配三维注册方法及系统-CN202310155912.5有效
发明人：雍玖;雷晓妹;魏建国;王阳萍;党建武;路文焕;杨景玉;王松;任鹏百 -专利权人：兰州交通大学
申请日： 2023-02-23 - 公布日： 2023-09-08 - 主分类号： G06V20/20 文献下载
摘要：本发明公开一种复杂场景下端到端的AR辅助装配三维注册方法及系统，涉及AR辅助装配技术领域，训练好的位姿预测模型包括依次连接的特征提取模块和位姿预测模块，特征提取模块采用特征注意力机制和多尺度网络框架，位姿预测模块采用线性回归、可微渲染器和位姿校准网络，后续利用训练好的位姿预测模型确定场景图像中的待注册对象的预测位姿，以进一步根据预测位姿将虚拟信息渲染至待注册对象上，从而实现虚拟信息的渲染，通过采用新型结构的训练好的位姿预测模型，能够实现强适应性、高准确度和实时性的位姿预测，从而有效提高实际AR辅助装配作业的效率。
复杂场景下端 ar 辅助装配三维注册方法系统

[发明专利]基于算子分裂及改进半拉格朗日求解污染物传播的方法-CN201910551021.5有效
发明人：侯庆志;刘晓楠;魏建国;练继建;党建武 -专利权人：天津大学
申请日： 2019-06-24 - 公布日： 2023-08-18 - 主分类号： G06F30/20 文献下载
摘要：本发明涉及流体力学技术领域，为实现在满足数值精度的前提下使用改进半拉格朗日方法更简洁快速地模拟流体中的污染物传播问题，本发明，基于算子分裂及改进半拉格朗日求解污染物传播的方法，步骤如下：步骤一，初始化系统的相关变量和运行参数；步骤二，生成粒子信息；步骤三，列出求解方程并迭代计算：根据算子分裂思想将对流、扩散和反应三个过程分别采用不同的数值方法计算；步骤四，输出结果：每一个时间步结束，保存该时间步的计算结果并更新；结束时间循环，输出最终结果。本发明主要应用于模拟流体中的污染物传播场合。
基于算子分裂改进半拉格朗日求解污染物传播方法

[发明专利]基于浸入式边界方法的连续元音生成方法-CN201810720404.6有效
发明人：路文焕;邓杰;侯庆志;魏建国;党建武 -专利权人：天津大学
申请日： 2018-07-03 - 公布日： 2023-08-11 - 主分类号： G06F30/23 文献下载
摘要：本发明涉及气体动力学和声学技术，为处理任意的移动复杂边界，避免贴体网格的使用，以及因网格重构和网格畸变带来的数值发散问题，本发明，基于浸入式边界方法的连续元音生成方法，步骤如下：步骤一，初始化包括计算域、网格间距、计算域网格即欧拉网格数、拉格朗日点数、计算步长、声速、空气密度、采样时间、声源点位置的相关变量和运行参数；步骤二，生成欧拉网格和拉格朗日点信息，设置观察点；步骤三，初始化完美匹配层；步骤四，在线性欧拉方程中加入一个附加力来代替复杂边界或者浸入边界，然后再利用时域有限差分方法来离散欧拉方程并迭代计算；步骤五，输出结果。本发明主要应用于连续元音生成场合。
基于浸入边界方法连续元音生成

[发明专利]一种基于静态-动态注意力变分网络的对话生成方法-CN201911250610.6有效
发明人：贺瑞芳;王瑞芳;常金鑫;王龙标;党建武 -专利权人：天津大学
申请日： 2019-12-09 - 公布日： 2023-06-30 - 主分类号： G06F16/33 文献下载
摘要：本发明公开一种基于静态‑动态注意力变分网络的对话生成方法，包括如下步骤：1)构建上下文理解模块：利用包括句子编码器和上下文编码器构成的分层编码器，编码输入的上下文，得到关于对话上下文的历史向量；2)构建主旨提取模块：引入基于vMF分布的识别/先验(recognition/prior)网络和静态注意力机制得到全局结构信息的潜在表示和关于回复中心思想的主旨表示；3)构建回复生成模块：结合解码器、动态注意力机制，将历史向量，潜在表示和主旨表示作为输入，捕获局部产生更加多样性和有意义的回复。该对话生成方法利用静态和动态注意力机制从全局和局部的角度捕获相关信息，生成更加语义相关和多样化的回复。其实验结果在相较现在的模型在各项实验指标上取得了更好的结果。
一种基于静态动态注意力网络对话生成方法

[发明专利]一种基于回复者个人特征增强的对话生成方法-CN201911062516.8有效
发明人：贺瑞芳;王瑞芳;常金鑫;王龙标;党建武 -专利权人：天津大学
申请日： 2019-11-03 - 公布日： 2023-06-30 - 主分类号： G06F16/33 文献下载
摘要：本发明公开了一种基于回复者个人特征增强的对话生成方法，包括如下步骤：1)构建2个encoder‑decoder基本框架；2)利用vMF分布在encoder‑decoder模型上构建基于vMF分布的VAE模型作为个人特征提取器，得到基于上下文的回复者个人特征潜在变量；3)利用个人特征潜在变量和vMF分布在encoder‑decoder模型上构建CVAE生成模型作为信息增强生成器，得到融合回复者个人特征潜在变量和上下文的响应。该对话生成方法通过建模回复者的个人特征和上下文，得到能够有效反应回复者的个人特征的响应并在相关评价指标上取得更好的结果。
一种基于回复个人特征增强对话生成方法

[发明专利]基于YOLO v4的无人机影像路面病害检测方法-CN202211660091.2在审
发明人：杨景玉;王阳萍;安学刚;李文海;王锋;党建武;李志强;岳彪;侯金泉;雍玖 -专利权人：兰州交通大学;甘肃路桥飞宇交通设施有限责任公司
申请日： 2022-12-23 - 公布日： 2023-06-23 - 主分类号： G06V20/10 文献下载
摘要：本发明涉及一种基于YOLOv4的无人机影像路面病害检测方法，属于路面病害检测领域。采用深度可分离卷积作为YOLOv4中卷积方式降低了网络的复杂度和减少模型计算的参数量；SE通道注意力按照每个通道的重要性分配不同的权重，有效利用通道间的信息；自适应特征融合模块充分学习高低层之间的特征信息，自适应地学习各尺度特征映射融合的空间权重，解决了由于YOLOv4中特征金字塔和路径聚合网络特征融合不充分问题，通过加入SE注意力机制和自适应特征融合模块能够进一步提高网络精度；采用的Focalloss损失函数解决了部分样本数量不均衡的问题，提高了路面病害检测精度。
基于 yolo v4 无人机影像路面病害检测方法

[发明专利]基于性别、国籍和情感信息的声纹识别方法-CN202010011692.5有效
发明人： 党建武;李凯;王龙标 -专利权人：天津大学
申请日： 2020-01-06 - 公布日： 2023-06-06 - 主分类号： G10L17/02 文献下载
摘要：本发明公开了基于性别、国籍和情感信息的声纹识别方法,步骤具体如下：首先数据预处理，其次特征的提取，然后神经网络参数训练：神经网络的具体结构，在训练过程中，首先打乱训练句子的输入顺序，然后随机选择128句作为一个训练batch，数据迭代次数为80；打分融合工具需要的训练文件是每一个系统的开发集和测试集结果；测试集使用的是VOXCELEB1 test；开发集是基于1211个训练说话人语句生成的包含4万个测试对的测试文件；然后经过100次迭代得到最终的测试集打分结果。本发明提升了识别率。
基于性别国籍情感信息声纹识别方法

[发明专利]一种基于脑电源成像的连续语音包络神经夹带提取方法-CN202110390302.4有效
发明人：张高燕;吴双;党建武;张卓;周迪;王龙标 -专利权人：天津大学
申请日： 2021-04-12 - 公布日： 2023-04-07 - 主分类号： A61B5/372 文献下载
摘要：本发明公开了一种基于脑电源成像的连续语音包络神经夹带提取方法，包括如下步骤：编制语音信号并提取语音信号包络；采集被试在语音信号刺激下的脑电数据；对采集的脑电数据进行预处理；对多个被试的脑电数据采用时空对准方法，提取电极空间共同神经响应；计算提取的电极空间共同神经响应在脑源空间的映射；基于mTRF算法由语音包络预测源空间共同神经响应；计算源空间上连续语音包络的神经夹带；由预测得到的源空间共同神经响应，与计算得到的共同神经响应在脑源空间的映射间的皮尔逊相关系数，评估神经夹带。本发明结合共同神经反应提取和源重构方法，便于在源空间中分析脑电和语音的耦合效应，分析连续语音感知和理解过程中人脑的工作机制。
一种基于电源成像连续语音包络神经夹带提取方法

[发明专利]基于关键点编码和多脉冲学习的环境声音识别方法-CN201910101670.5有效
发明人：于强;姚艳丽;王龙标;党建武 -专利权人：天津大学
申请日： 2019-01-31 - 公布日： 2022-12-30 - 主分类号： G10L15/16 文献下载
摘要：本发明公开一种基于关键点编码和多脉冲学习的环境声音识别方法,通过仿脑的信息处理机制来完成环境声音的动态、高效、鲁棒识别,使用RWCP数据库作为处理对象，整个系统包括以下三个部分：数据预处理、特征提取和分类器分类。本发明提出了一种基于稀疏关键点编码结合脉冲神经网络的方法，利用离散的脉冲进行声音的识别。为了充分利用整个时间窗内的有效信息，本发明采用多脉冲输出的学习算法，使用特定区间的脉冲数来引导神经元学习。
基于关键编码脉冲学习环境声音识别方法

[发明专利]基于多帧预测的轻量级端到端语音合成系统构建方法-CN202210991094.8在审
发明人：王龙标;刘钰澔;党建武 -专利权人：天津大学
申请日： 2022-08-18 - 公布日： 2022-11-22 - 主分类号： G10L13/027 文献下载
摘要：本发明属于语音合成领域，涉及基于多帧预测的轻量级端到端语音合成系统构建方法。包括多帧并行生成，基于VAE的快速并行，基于时序信息L‑VAE的快速并行，将全连接层换为一个长短时记忆网络，用它来提取深层信息，并且保证时序性，最后基于知识蒸馏的快速端到端语音合成系统构建。本发明使推理速度得到一个明显的提升而且克服了提升速度带来的音质的衰退，从而保证了其结果的正确以及自然性。
基于预测轻量级端到端语音合成系统构建方法

[发明专利]基于高层信息监督的自蒸馏模型压缩算法-CN202210729125.2在审
发明人：徐强;王龙标;于强;党建武 -专利权人：天津大学
申请日： 2022-06-24 - 公布日： 2022-10-21 - 主分类号： G06N20/00 文献下载
摘要：本发明公开一种高层信息监督的自蒸馏模型压缩算法，主要包括构建基于ctc/conformer混合模型的teacher和student模型；预训练第一个阶段是预训练阶段，第二个阶段是NFSD将student模型的所有层两两一组进行分组，每个组内的较深层的网络输出作为另一层网络输出的指导信息，计算两层网络的均方误差损失，并求和所有组的均方误差损失，在student反向传播过程中，优化该均方误差损失和student模型本身的交叉熵损失。AFSD对于student模型的每一层，计算该层的输出与其之后的所有层的输出的相似度，并用此相似度对该层之后的所有层的输出进行加权求和，加权求和的结果作为该层的指导信息，在student反向传播过程中，优化该均方误差损失和student模型本身的交叉熵损失，直到student模型收敛。
基于高层信息监督蒸馏模型压缩算法

1
2
3
4
5
6
7
下一页»
尾页
共 99 条