[发明专利]一种基于对比学习的自然文本编码方法在审
申请号: | 202310197311.0 | 申请日: | 2023-03-03 |
公开(公告)号: | CN116070591A | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 王骞 | 申请(专利权)人: | 成都瑞贝英特信息技术有限公司 |
主分类号: | G06F40/126 | 分类号: | G06F40/126;G06F40/30;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于对比学习的自然文本编码方法,包括以下步骤:对自然文本数据集进行增强处理,通过数据增强获取正样本对;建立对比学习模型,对比学习模型采用预训练模型作为Encoder;进行对比学习模型训练;得到自然文本的编码结果。本发明通过使用Prompt机制可以使模型更加理解自然文本编码任务,从而获取更好的编码质量;以一种连续的方式对离散的文本数据进行数据增强,保持增强前后的语义一致,从而获取质量更好的正样本对。利用连续的数据增强获取高质量的正样本对,而使用Paraphraser和Bottleneck对正样本对的特征向量进行对齐表示并挖掘更多的信息来进行对比学习以获取更好的性能。 | ||
搜索关键词: | 一种 基于 对比 学习 自然 文本 编码 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都瑞贝英特信息技术有限公司,未经成都瑞贝英特信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310197311.0/,转载请声明来源钻瓜专利网。