[发明专利]句向量模型的训练方法、文本语义增强的方法及装置有效
申请号: | 202310833852.8 | 申请日: | 2023-07-07 |
公开(公告)号: | CN116579320B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 朱权;郑重;王潇茵;杜婉茹;丁醒醒;李瑞群;孙鹏程 | 申请(专利权)人: | 航天宏康智能科技(北京)有限公司 |
主分类号: | G06F40/20 | 分类号: | G06F40/20;G06F40/30;G06F18/214;G06F18/22;G06N3/048;G06N3/09 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 王兆赓;苏银虹 |
地址: | 100048*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开提供了一种句向量模型的训练方法、文本语义增强的方法及装置,其中训练方法包括:从预先构建的训练数据集获取预定数量的数据对;构建数据对中的输入序列,并将输入序列转换为对应的token序列;将token序列分别输入至嵌入层,得到对应的嵌入序列;将每种嵌入序列输入至自注意力层,得到每种嵌入序列的相关性序列;将每种相关性序列输入至池化层,得到用于表示每种相关性序列的初始向量;将每种初始向量输入至线性层,得到对应的目标向量;以最小化反映锚样本的方面词向量、正样本的句向量以及负样本的句向量的三元组损失函数为目标,对句向量模型进行训练。该过程降低了文本语义增强模型的复杂度,减少了人工成本和时间成本。 | ||
搜索关键词: | 向量 模型 训练 方法 文本 语义 增强 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天宏康智能科技(北京)有限公司,未经航天宏康智能科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310833852.8/,转载请声明来源钻瓜专利网。