[发明专利]用于获取信息的方法及装置在审
申请号: | 201910575974.5 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110287400A | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 王乐义;黄相凯;安思宇;刘明浩;郭江亮;李旭 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/9532 | 分类号: | G06F16/9532;G06F16/332;G06F16/955 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 初始信息 搜索关键词 备选信息 权重 获取信息 目标信息 选择信号 云计算 响应 展示 | ||
本公开的实施例公开了用于获取信息的方法及装置,涉及云计算领域。该方法的一具体实施方式包括:获取包含搜索关键词的至少一条初始信息,其中,初始信息包含上述搜索关键词;对于上述至少一条初始信息中的初始信息,计算上述搜索关键词在该初始信息中的权重值,上述权重值用于表征搜索关键词在初始信息中的重要程度;将大于设定权重阈值的权重值对应的初始信息标记为备选信息,并展示上述备选信息;响应于接收到对应上述备选信息的选择信号,将上述选择信号对应的备选信息设置为目标信息。该实施方式提高了目标信息的有效性。
技术领域
本公开的实施例涉及计算机技术领域,具体涉及用于获取信息的方法及装置。
背景技术
随着网络技术的发展,用户可以登录网站搜索各种信息或购买物品。网站可以存储有海量的信息,并根据用户的搜索关键词向用户提供信息,提高了用户获取信息的效率。通常,用户在网站输入搜索关键词后,可以获取到多个信息。之后,用户可以对信息进行筛选,以得到需要的信息。
发明内容
本公开的实施例提出了用于获取信息的方法及装置。
第一方面,本公开的实施例提供了一种用于获取信息的方法,该方法包括:获取包含搜索关键词的至少一条初始信息,其中,初始信息包含上述搜索关键词;对于上述至少一条初始信息中的初始信息,计算上述搜索关键词在该初始信息中的权重值,上述权重值用于表征搜索关键词在初始信息中的重要程度;将大于设定权重阈值的权重值对应的初始信息标记为备选信息,并展示上述备选信息;响应于接收到对应上述备选信息的选择信号,将上述选择信号对应的备选信息设置为目标信息。
在一些实施例中,上述权重值通过以下步骤得到:将初始信息划分为至少一个待处理词条,并查询至少一个待处理词条中每个待处理词条的词条特征,其中,上述词条特征包括以下至少一项:词性、句子成分、信息类型;根据上述至少一个待处理词条中的待处理词条在初始信息中的位置,为待处理词条设置位置信息,并根据上述位置信息确定上述待处理词条的上下文信息;将上述至少一个待处理词条和对应至少一个待处理词条中每个待处理词条的词条特征和上下文信息导入预先训练的词条权重值计算模型,得到对应上述至少一个待处理词条中每个待处理词条的权重值,其中,上述词条权重值计算模型用于通过词条特征和上下文信息计算待处理词条的权重值。
在一些实施例中,上述词条权重值计算模型通过以下步骤训练得到:获取多个样本信息和对应上述多个样本信息中每个样本信息包含的样本词条的样本词条特征、样本上下文信息和样本权重值,其中,样本权重值用于表征样本词条在样本信息中的重要程度;将上述多个样本信息的每个样本信息包含的样本词条的样本词条特征、样本上下文信息作为输入,将上述多个样本信息中的每个样本信息包含的样本词条所对应的样本权重值作为输出,训练得到上述词条权重值计算模型。
在一些实施例中,上述将上述多个样本信息的每个样本信息包含的样本词条的样本词条特征、样本上下文信息作为输入,将上述多个样本信息中的每个样本信息包含的样本词条所对应的样本权重值作为输出,训练得到上述词条权重值计算模型,包括:执行以下训练步骤:将上述多个样本信息中的每个样本信息包含的样本词条的样本词条特征、样本上下文信息输入至初始词条权重值计算模型,得到上述多个样本信息中的每个样本信息的样本词条所对应的预测权重值,将上述多个样本信息中的每个样本信息的样本词条所对应的预测权重值与该样本词条所对应的样本权重值进行比较,得到上述初始词条权重值计算模型的预测准确率,确定上述预测准确率是否大于预设准确率阈值,若大于上述预设准确率阈值,则将上述初始词条权重值计算模型作为训练完成的词条权重值计算模型。
在一些实施例中,上述将上述多个样本信息的每个样本信息包含的样本词条的样本词条特征、样本上下文信息作为输入,将上述多个样本信息中的每个样本信息包含的样本词条所对应的样本权重值作为输出,训练得到上述词条权重值计算模型,包括:响应于不大于上述预设准确率阈值,调整上述初始词条权重值计算模型的参数,并继续执行上述训练步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910575974.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:直播信息处理方法、装置、电子设备及存储介质
- 下一篇:通知系统以及通知方法