[发明专利]查询词嵌入扩展词和统计扩展词并集的中文查询扩展方法在审
申请号: | 202010774442.7 | 申请日: | 2020-08-04 |
公开(公告)号: | CN111897928A | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 黄名选 | 申请(专利权)人: | 广西财经学院 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332 |
代理公司: | 广西南宁明智专利商标代理有限责任公司 45106 | 代理人: | 林兴宁 |
地址: | 530007 广西壮族*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种查询词嵌入扩展词和统计扩展词并集的中文查询扩展方法,其利用深度学习工具对对初检文档集进行词嵌入语义学习训练,得到词向量集,计算每个查询词项与所有非查询词项的向量余弦相似度并降序排列,提取前列非查询词项作为查询词项词嵌入扩展词,得到查询词项词嵌入扩展词集,然后利用基于Copulas理论的统计扩展词挖掘方法对伪相关反馈文档集挖掘统计扩展词,建立统计扩展词集,最后将查询词项词嵌入扩展词集和统计扩展词集进行并集得到最终扩展词,最终扩展词和原查询组合为新查询,再次检索文档集,实现查询扩展。本发明将查询词嵌入扩展词和统计扩展词并集融合,能挖掘出与原查询相关的高质量扩展词,提高和改善文本信息检索性能。 | ||
搜索关键词: | 查询 嵌入 扩展 统计 中文 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西财经学院,未经广西财经学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010774442.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种可快速脱离的分支线夹
- 下一篇:一种锂离子电池储能系统自动灭火系统及方法