[发明专利]一种基于自学习的场景文本匹配方法及系统在审
申请号: | 202211524896.4 | 申请日: | 2022-11-30 |
公开(公告)号: | CN115759068A | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 周婷婷;焦旭;徐圣源;梁变 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/216;G06F18/2135;G06F18/24 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 311121 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于自学习的场景文本匹配方法及系统,选择预训练词向量数据集,将场景语料数据转化为预训练词向量数据集对应的场景词向量;自定义设置场景语料样本数量阈值,当场景语料数据小于场景语料样本数量阈值时,场景语料数据作为少量样本,将其输入到无监督学习模型中转化为对应的第一场景文本向量;在场景语料数据积累超过设置的场景语料样本数量阈值后,将其输入有监督学习模型转化为对应的第二场景文本向量;计算第一场景文本向量、第二场景文本向量与待匹配文本的文本相似度并排序,修正文本匹配结果,得到文本匹配对;依据文本匹配对优化无监督学习模型和有监督学习模型,修正文本相似度的计算方式。 | ||
搜索关键词: | 一种 基于 自学习 场景 文本 匹配 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211524896.4/,转载请声明来源钻瓜专利网。