[发明专利]基于近似词的模糊匹配媒资内容库检索方法在审
申请号: | 202110445489.3 | 申请日: | 2021-04-25 |
公开(公告)号: | CN112988977A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 杨瀚;朱婷婷;温序铭;李忠玮;严照宇 | 申请(专利权)人: | 成都索贝数码科技股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/338;G06F40/289;G06F40/30;G06F16/951 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 贾年龙 |
地址: | 610041 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于近似词的模糊匹配媒资内容库检索方法,包括步骤:S1,获取新闻文本语料,构建用于训练FastText模型的学习样本;S2,基于所构建的学习样本进行FastText模型的训练,获得词向量模型;S3,利用训练好的词向量模型和近似最近邻方法Hnswlib构建近似词检索模型,利用近似词检索模型获取输入的检索词的相似词作为扩展目标检索词组,基于该扩展目标检索词组在内容库中进行相关素材检索,然后将检索结果返回给用户等;本发明基于召回的所有近似词进行扩展检索的方式将完全匹配检索转换成模糊匹配检索,能够在更好地覆盖用户的检索意图的情况下获得更广泛且与用户想要的结果相关的素材检索结果。 | ||
搜索关键词: | 基于 近似 模糊 匹配 内容 检索 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都索贝数码科技股份有限公司,未经成都索贝数码科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110445489.3/,转载请声明来源钻瓜专利网。