|
钻瓜专利网为您找到相关结果 24个,建议您 升级VIP下载更多相关专利
- [发明专利]文本摘要抽取方法和系统-CN202310237922.3在审
-
汪诚愚;唐莫鸣
-
阿里巴巴(中国)有限公司
-
2023-03-07
-
2023-07-18
-
G06F16/34
- 本公开涉及一种文本摘要抽取方法和系统。该方法包括:从包含L个句子的给定文档中选取M个句子,以构造N个候选摘要;将每个候选摘要与给定文档级联并送入PLM,获取N个输出向量;将N个输出向量送入文本释义排序模型,获取N个释义概率;从N个释义概率中选择最高概率对应的候选摘要作为给定文档的抽取文本摘要。本发明通过将摘要抽取任务转化为候选摘要与源文本之间的文本释义问题,缩小摘要抽取任务和PLM的训练差距,能够更好地挖掘PLM的知识用以提升模型性能。进一步地,利用知识迁移从现有文本释义丰富训练数据集中学习相关知识,辅助模型识别更能释义文档核心语义的候选摘要,弥补小规模数据集导致的训练监督信号缺失问题。
- 文本摘要抽取方法系统
- [发明专利]学生模型训练方法和文本分类系统-CN202310240085.X在审
-
汪诚愚;陈小庆
-
阿里巴巴(中国)有限公司
-
2023-03-07
-
2023-07-14
-
G06N3/08
- 本公开涉及一种学生模型训练方法和文本分类系统。该方法包括:向样本添加提示信息和掩码文本占位符以得到经处理的训练样本;使用经处理的训练样本微调预训练语言模型PLM,得到经提示微调的教师模型;使用有标签的域外训练数据微调PLM,得到经域外数据微调的教师模型;以及使用经处理的训练样本训练学生模型,并且在训练过程中所述学生模型同时学习如上两个教师模型输出的分类概率向量。本发明通过在知识蒸馏时引入域外教师模型,提升了学生模型的蒸馏精度。进一步地,可以根据域内模型的专家评分对域外教师模型的影响程度加以控制。还可以通过额外的伪分类概率向量来进一步缓解小样本场景下由于标签缺乏导致的过拟合。
- 学生模型训练方法文本分类系统
- [发明专利]视觉语言理解任务处理方法和系统-CN202310240088.3在审
-
汪诚愚;唐莫鸣
-
阿里巴巴(中国)有限公司
-
2023-03-07
-
2023-07-14
-
G06F18/214
- 本公开涉及一种视觉语言理解任务处理方法和系统。所述方法基于视觉语言预训练模型操作,并且包括:构造包括多个图像‑文本对的任务训练数据;将训练数据送入预训练模型以获取位于多个图像和文本嵌入向量;将同一图像文本对的嵌入向量融合为一个融合特征;基于多个融合特征构造知识库原型矩阵;以及使用原型矩阵进行相似度匹配以获取推理结果。本发明将各种视觉语言理解任务重新表述为一个开卷的相似性匹配问题,采用知识库原型矩阵通过融合特征记录每个类别的显着特征,再使用图像‑文本对与每个类别的原型进行相似性匹配。在下游任务的微调阶段,可通过对比学习利用真实标签的隐式排序信息,从低资源训练集中提供更多监督线索。
- 视觉语言理解任务处理方法系统
|