专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果306个,建议您升级VIP下载更多相关专利
  • [发明专利]一种鲁棒哈希的不配对零样本图文跨模态检索方法-CN202310902853.3在审
  • 舒振球;永凯玲;余正涛 - 昆明理工大学
  • 2023-07-21 - 2023-10-24 - G06F16/432
  • 本发明公开了一种鲁棒哈希的不配对零样本图文跨模态检索方法。能有效地解决同时包含噪声标签以及不配对的检索场景。该方法设计了一个零样本图文跨模态哈希检索框架为图像和文本两个模态学习不同的哈希码,使其适用于不配对检索场景。此外,该方法分别为噪声矩阵和恢复的标签矩阵上施加了稀疏约束和低秩约束,以有效地降低噪声标签的负面影响。然后,在标签语义嵌入学习中引入ε拖曳,以此来学习更具判别性的哈希码。为了增强哈希码中的相似性语义信息,同时考虑了模态内相似性和模态间相似性。本发明提高了在带有噪声标签的不配对零样本图文跨模态检索的检索精度。
  • 一种鲁棒哈希配对样本图文跨模态检索方法
  • [发明专利]基于离散化自监督表征增强的非自回归建模方法-CN202310933874.1在审
  • 高盛祥;冯子健;余正涛 - 昆明理工大学
  • 2023-07-27 - 2023-10-24 - G10L13/02
  • 本发明涉及基于离散化自监督表征增强的非自回归建模方法,属于自然语言处理技术领域。本发明首先结合老挝语的语言语音特点,在老挝语音素粒度上标注时长信息,其次使用非自回归架构建模声学模型,避免数据稀缺情况下自回归模型注意力机制泛化能力差的问题。通过自监督学习的预训练语音模型来提取语音内容和声调信息的离散化表征,融入到声学模型中增强模型的语音生成能力,增强合成音频的流畅性和自然性。本发明提出的基于离散化自监督表征增强的非自回归建模方法,能更好的在声调、音素时长、音高等细粒度层面刻画老挝语的语音特性。
  • 基于离散监督表征增强回归建模方法
  • [发明专利]融合词粒度概率映射信息的汉越跨语言摘要方法-CN202110958255.9有效
  • 张亚飞;李笑萌;郭军军;高盛祥;余正涛 - 昆明理工大学
  • 2021-08-20 - 2023-10-17 - G06F40/58
  • 本发明涉及融合词粒度概率映射信息的汉越跨语言摘要方法,属于自然语言处理技术领域。本发明包括步骤:语料收集;对收集的语料进行分词预处理;并利用fast‑align工具及统计的思想获得汉越概率映射对;并采用编解码注意力机制,以此获取基于汉语文章摘要的关键词;概率映射机制的构建;词级概率映射信息的融入;本发明对汉越词粒度的信息和其篇章级的文本进行表征;其次,基于注意力机制对词粒度的信息和篇章级文本进行联合表征;最后,通过融合词粒度的对齐信息到目标语言的摘要,提高摘要的准确性。本发明在汉‑越跨语言摘要数据集上进行了实验,实验证明了本发明的有效性和优越性。
  • 融合粒度概率映射信息汉越跨语言摘要方法
  • [发明专利]基于声学空间分布约束的越南语语音识别数据筛选方法-CN202310785589.X在审
  • 高盛祥;周杰;余正涛;王文君;曾令帆 - 昆明理工大学
  • 2023-06-29 - 2023-10-10 - G10L15/02
  • 本发明涉及基于声学空间分布约束的越南语语音识别数据筛选方法,属于自然语言处理技术领域。本发明包括步骤:将文本转换为音素序列,再使用越南语语音文本对齐模型将音素序列和无标签语料的语音对齐获得对齐的伪标签语料;对初始化的教师模型进行微调,并使用微调好的教师模型通过无标签语料数据得到伪标签语料;对对齐的伪标签语料和伪标签语料利用声学空间分布约束的声调贡献度进行筛选,再对学生模型进行自训练;得到最佳的越南语语音识别模型,并利用越南语语音测试集进行实验验证。本发明通过标签置信度来约束伪标签弱监督信号对于训练过程的贡献。在自训练的过程中添加伪数据筛选方法有效提升了低资源下的越南语语音识别上的识别效果。
  • 基于声学空间分布约束越南语语音识别数据筛选方法
  • [发明专利]一种基于多注意力机制的单通道语音增强方法-CN202310795845.3在审
  • 高盛祥;莫尚斌;余正涛 - 昆明理工大学
  • 2023-07-01 - 2023-10-10 - G10L21/02
  • 本发明涉及一种基于多注意力机制的单通道语音增强方法,属于音频信号处理技术领域。本发明在复数U‑Net网络中引入复数Conformer对语音幅度和相位的相关性进行建模,利用三维度注意力机制构造更加丰富的特征来增强卷积层的表示能力,通过门控注意力机制融合语音细节特征和深层特征。该方法能提高语音质量和可理解性,可用于嘈杂环境中的语音通信,口令控制及与语音相关任务的前处理部分。在公开数据集上的实验结果表明,所提方法在五种客观评价指标PESQ、CSIG、CBAK、COVL、STOI上,分别取得了的3.09、4.28、3.47、3.72、95.07评测结果,可有效降低噪声、提高语音质量和可理解性。
  • 一种基于注意力机制通道语音增强方法
  • [发明专利]一种基于预训练模型提示微调的无监督短语抽取方法-CN202310690973.1在审
  • 线岩团;龙彪;余正涛;王红斌;相艳 - 昆明理工大学
  • 2023-06-12 - 2023-09-12 - G06F40/186
  • 本发明公开的一种基于预训练模型提示微调的无监督短语抽取方法,包括如下步骤:S1、使用自定义嵌入层对模版进行嵌入,然后将两种结果拼接得到带有文本信息和模版信息的向量;S2、利用预训练语言模型中的注意力结构生成一个向量序列,然后对向量序列进行降维;S3、计算全局语义模板向量与局部语义模板向量的KL散度,并使用句子长度对分数进行约束以避免出现局部最优解;S4、将得到每个词在背景和全局上的分数;S5、应用全局分数与背景分数的差值大于某个阈值的连续位置认为该片段为关键短语来进行短语抽取。本发明够有效地分离文本中的背景语义信息和全局语义信息,并利用单词在背景信息和语义信息上的分数差无监督地定位关键短语。
  • 一种基于训练模型提示微调监督短语抽取方法
  • [发明专利]基于跨语言特征解耦器的柬埔寨语说话人音色迁移方法-CN202310627760.4在审
  • 高盛祥;杨元樟;余正涛 - 昆明理工大学
  • 2023-05-31 - 2023-08-29 - G10L25/18
  • 本发明涉及基于跨语言特征解耦器的柬埔寨语说话人音色迁移方法,属于语音信号处理技术领域。本发明借助中英文等富资源语种,将柬埔寨说话人音色,转为中英文说话人音色。柬埔寨多说话人语料库稀缺,常规方法实现柬埔寨语说话人迁移性能不佳。使用中英富资源扩充数据面临着语言特征、说话人音色特征难解耦的问题,本发明使用中英富资源语料库扩增说话人音色数据,构建跨语言特征解耦器,实现柬埔寨说话人音色有效转换为中英说话人音色而不改变柬埔寨语的语音内容,实验结果显示,本发明方法合成音频达到了3.81的MOS评分。实现了说话人音色的有效解耦及可控迁移。
  • 基于语言特征解耦器柬埔寨说话音色迁移方法
  • [发明专利]基于跨模态表征对齐的英越端到端语音翻译方法-CN202310646473.8在审
  • 余正涛;周国江;高盛祥 - 昆明理工大学
  • 2023-06-02 - 2023-08-29 - G06F40/58
  • 本发明涉及基于跨模态表征对齐的英越端到端语音翻译方法,属于自然语言处理技术领域。本发明基于英语音频表征与文本表征的长度信息,进行对齐并分别混合得到词级与句子级的混合表征;使用长度归一化融合方法统一混合表征与音频表征的长度以减轻混合表征与语音表征之间由长度导致的模态差异问题,使用门控融合方法对混合表征进一步融合得到多粒度混合表征作为解码器输入,对不同模态的输出进行一致性在多任务训练框架下约束,实现英语语音表征与对应文本表征的跨模态对齐。本发明为后续在英语到越南语端到端语音翻译以及语音与文本跨模态表征对齐等工作提供强有力的支撑,缓解了英语到越南语语音翻译的跨模态映射困难问题。
  • 基于跨模态表征对齐英越端到端语音翻译方法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top