[发明专利]文本检索方法及装置在审
申请号: | 202310863139.8 | 申请日: | 2023-07-14 |
公开(公告)号: | CN116610795A | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 徐琳;暴宇健;王芳 | 申请(专利权)人: | 深圳须弥云图空间科技有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06N20/00;G06F16/332;G06F16/33 |
代理公司: | 北京嘉科知识产权代理事务所(特殊普通合伙) 11687 | 代理人: | 马瑞 |
地址: | 518054 广东省深圳市南山区粤海街道海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检索 方法 装置 | ||
1.一种文本检索方法,其特征在于,所述方法包括:
将待检索问题语句输入到预置的相关性评分模型的问题编码器,其中,所述相关性评分模型具有双塔式框架,所述双塔式框架的两个分支分别为文档编码器和所述问题编码器,所述相关性评分模型的训练数据中的部分负难例使用第一语言模型生成;
将根据文档库中的在库文档使用所述第一语言模型生成的伪问题语句和对应的在库文档输入所述文档编码器,其中,所述文档编码器具有交互式框架;
获取所述相关性评分模型输出的所述待检索问题语句与所述文档库中的在库文档的相关性得分;
根据所述相关性得分获取所述待检索问题语句的检索文本。
2.根据权利要求1所述的方法,其特征在于,所述相关性评分模型的训练方法包括:
将根据训练文档使用所述第一语言模型生成的伪训练问题语句输入初始评分模型的问题编码器,并将伪训练问题语句和训练文档输入到所述初始评分模型的文档编码器,其中,所述初始评分模型为所述相关性评分模型的初始模型,所述相关性评分模型的第一训练数据包括所述伪训练问题语句和所述训练文档;
获取所述初始评分模型输出的相关性评价分数;
根据所述相关性评价分数和所述第一训练数据对应的训练标签对所述初始评分模型进行训练,得到训练好的中间评分模型;
选取第二训练数据对所述中间评分模型进行训练,得到所述相关性评分模型。
3.根据权利要求2所述的方法,其特征在于,在对所述初始评分模型进行训练的前三分之一迭代次数中,使用第一语言模型生成的部分负难例占全部负难例的30%,在对所述初始评分模型进行训练的中三分之一迭代次数中,使用第一语言模型生成的部分负难例占全部负难例的50%,在对所述初始评分模型进行训练的后三分之一迭代次数中,使用第一语言模型生成的部分负难例占全部负难例的60%。
4.根据权利要求2所述的方法,其特征在于,对所述初始评分模型进行训练,包括:采用对比学习损失函数对所述初始评分模型进行训练;
对所述中间评分模型进行训练,包括:采用对比学习损失函数对所述中间评分模型进行训练。
5.根据权利要求2所述的方法,其特征在于,对所述初始评分模型进行训练时采用的样本的正例和负例的数量比包括1:7;和/或,
对所述初始评分模型进行训练时单次传递给程序的样本数量包括32。
6.根据权利要求2所述的方法,其特征在于,所述初始评分模型包括以下任一种模型:来自转换器的双向编码器表示、强力优化的来自转换器的双向编码器表示、轻量级来自转换器的双向编码器表示和简单的来自转换器的双向编码器表示。
7.根据权利要求1所述的方法,其特征在于,将根据文档库中的在库文档使用所述第一语言模型生成的伪问题语句和对应的在库文档输入所述文档编码器之前,所述方法还包括:
对各个所述在库文档进行最大或最小前K个元素次伪问题语句生成,其中,K为自然数。
8.一种文本检索装置,其特征在于,所述装置包括:
问题编码模块,用于将待检索问题语句输入到预置的相关性评分模型的问题编码器,其中,所述相关性评分模型具有双塔式框架,所述双塔式框架的两个分支分别为文档编码器和所述问题编码器,所述相关性评分模型的训练数据中的部分负难例使用第一语言模型生成;
文档编码模块,用于将根据文档库中的在库文档使用所述第一语言模型生成的伪问题语句和对应的在库文档输入所述文档编码器,其中,所述文档编码器具有交互式框架;
相关性得分获取模块,用于获取所述相关性评分模型输出的所述待检索问题语句与所述文档库中的在库文档的相关性得分;
检索文本获取模块,用于根据所述相关性得分获取所述待检索问题语句的检索文本。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳须弥云图空间科技有限公司,未经深圳须弥云图空间科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310863139.8/1.html,转载请声明来源钻瓜专利网。