[发明专利]基于预训练模型的学术文本语义特征提取方法、系统和存储介质有效
申请号: | 202210778073.8 | 申请日: | 2022-07-04 |
公开(公告)号: | CN114841173B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 杜军平;王岳;薛哲;梁美玉 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/211;G06K9/62 |
代理公司: | 北京金咨知识产权代理有限公司 11612 | 代理人: | 宋教花 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于预训练模型的学术文本语义特征提取方法、系统和存储介质,所述方法包括:获取学术资源文本数据;将获得的学术资源文本数据输入至预训练模型,得到多维的学术文本语义特征向量;所述预训练模型是基于多重负样例损失函数对Bert预训练模型进行微调、将微调后的Bert预训练模型作为教师模型通过知识蒸馏来训练学生模型得到的学生预训练模型;将所述多维的学术文本语义特征向量进行降维压缩,输出最终的学术文本语义特征。本发明在提高向量生成质量的同时加快了向量生成的速度,适用于学术大数据场景下的文本向量生成。 | ||
搜索关键词: | 基于 训练 模型 学术 文本 语义 特征 提取 方法 系统 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210778073.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种网箱网衣受力易损部位检测系统
- 下一篇:一种具有喷涂稳定装置的涂装喷枪