[发明专利]一种输入中包含错误信息场景下的文档检索方法有效
申请号: | 202310517097.2 | 申请日: | 2023-05-09 |
公开(公告)号: | CN116226357B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 刘军平;龚明康;郭沛然;胡新荣;姚迅;杨捷 | 申请(专利权)人: | 武汉纺织大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/232;G06F40/247 |
代理公司: | 武汉世跃专利代理事务所(普通合伙) 42273 | 代理人: | 万仲达 |
地址: | 430073 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种输入中包含错误信息场景下的文档检索方法,包括:步骤1,对原始的查询文本进行攻击,生成一个包含错误信息的查询文本,以扩充数据集;步骤2,对生成的包含错误信息的查询文本进行预处理,检测其文本单词个数,并在其文本中随机插入[MASK]特殊字符;步骤3,将数据集中的不包含特殊字符的原始查询文本,不包含特殊字符的文档文本以及插入了特殊字符的包含错误的查询文本输入文档检索网络进行训练,获得文档检索模型;步骤4,使用训练好的文档检索模型进行结果测试,当输入一个查询时输出一系列与该查询最相关的文档。本发明可以有效避免查询中包含错误信息的场景下,文档检索模型检索准确率下降的状况。 | ||
搜索关键词: | 一种 输入 包含 错误信息 场景 文档 检索 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉纺织大学,未经武汉纺织大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310517097.2/,转载请声明来源钻瓜专利网。