[发明专利]一种产品文本的确定方法、装置、计算机设备和介质在审
申请号: | 201911344342.4 | 申请日: | 2019-12-24 |
公开(公告)号: | CN111104485A | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 王千;梁新敏;陈羲 | 申请(专利权)人: | 上海风秩科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/289;G06F40/30 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 许书音 |
地址: | 200333 上海市普陀*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 产品 文本 确定 方法 装置 计算机 设备 介质 | ||
本发明公开了一种产品文本的确定方法、装置、计算机设备和介质,所述方法包括:获取用户所提交的查询请求;其中,所述查询请求中携带有查询文本;生成与所述查询文本的语义相似度大于预设数值的拓展文本;根据所述查询文本和所述拓展文本,在产品文本数据库中筛选出多个产品文本;其中,所述产品文本存储的产品文本包括以下至少一种或几种:从网络中获取的产品文本、从线下资料中获取的产品文本;根据所述查询文本和所述拓展文本,计算每一个筛选出来的产品文本的第一相关性;根据每一个筛选出来的产品文本的第一相关性,确定用于向所述用户推送的产品文本。
技术领域
本申请涉及数据分析领域,尤其涉及一种产品文本的确定方法、装置、计算机设备和介质。
背景技术
网络中的信息多种多样,可供用户查阅的资料能达到几万个或几十万个,甚至是更多,为了让用户快速的找到用户所需要的资料,出现了搜索引擎以供可以对资料进行筛选,在众多的资料中,快速的找到用户所需要的资料。
通过搜索引擎所搜索资料时,仅仅是将包含有用户在搜索引擎中所输入文本的全部或部分内容的资料筛选出来,但是,这种搜索资料的方式搜索到的资料比较片面。
发明内容
有鉴于此,本申请的目的在于提供了一种产品文本的确定方法、装置、计算机设备和介质,以解决现有技术中如何提高搜索结果的全面性的问题。
第一方面,本申请实施例提供了一种产品文本的确定方法,包括:
获取用户所提交的查询请求;其中,所述查询请求中携带有查询文本;
生成与所述查询文本的语义相似度大于预设数值的拓展文本;
根据所述查询文本和所述拓展文本,在产品文本数据库中筛选出多个产品文本;其中,所述产品文本存储的产品文本包括以下至少一种或几种:从网络中获取的产品文本、从线下资料中获取的产品文本;
根据所述查询文本和所述拓展文本,计算每一个筛选出来的产品文本的第一相关性;
根据每一个筛选出来的产品文本的第一相关性,确定用于向所述用户推送的产品文本。
可选的,在获取用户所提交的查询请求之后,在生成与所述查询文本的语义相似度大于预设数值的拓展文本之前,还包括:
根据正确语料对所述查询文本进行纠错,以得到正确的查询文本。
可选的,所述根据所述查询文本和所述拓展文本,在产品文本数据库中筛选出多个产品文本,包括:
分别对所述查询文本和所述拓展文本进行分词;
针对所述查询文本中的每一个分词,在所述产品文本数据库中筛选出该分词所对应的产品文本;
针对拓展文本中的每一个分词,在所述产品文本数据库中筛选出该分词所对应的产品文本。
可选的,根据所述查询文本和所述拓展文本,计算每一个筛选出来的产品文本的第一相关性,包括:
根据所述查询文本和所述拓展文本生成标准文本;
根据标准文本,计算每一个筛选出来的产品文本的第一相关性。
可选的,所述根据标准文本,计算每一个筛选出来的产品文本的第一相关性,包括:
对所述标准文本进行分词,以得到分词结果;
针对每一个筛选出来的产品文本,根据所述分词结果中每一个分词在该产品文本的相关性,计算该产品文本与所述标准文本的第一相关性。
可选的,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海风秩科技有限公司,未经上海风秩科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911344342.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种透气球衣切裁机构
- 下一篇:一种图书馆图书标签整理系统